5년 동안 시민이 만든 15만 건의 분류 데이터가 — 다시 AI 의 눈을 가르치는 학습 셋이 되었다.
사진 1장이 아니라 영상이다
비치스캐너는 드론·고정 카메라·시민이 걸으면서 찍은 연속 영상 을 입력으로 받는다. 30초 영상 한 컷에는 — 100장의 사진보다 많은 정보가 담긴다. 시간 흐름·각도 변화·바람으로 움직이는 쓰레기·파도에 휩쓸리는 잔해 같은 — 정적 사진으로는 잡을 수 없는 신호.
| 입력 | 처리 시간 | 출력 |
|---|---|---|
| 영상 (10~60초) | 약 5~15초 | 19종 분류 · 양 추정 · 시계열 변화 · 이상 영역 박스 |
| 드론 영상 (1~5분) | 약 30초~2분 | 해변 전체 적치 지도 · 누적 부담 추정 · 핫스팟 좌표 |
| 시민 산책 영상 (1~10분) | 약 1~3분 | 경로상 쓰레기 분포 · 기존 데이터와 비교 |
15만 건 학습 모델 — 우리만의 데이터
| 학습 데이터 | 출처 | 양 |
|---|---|---|
| 사진 + ICC 19종 분류 라벨 | 시민이 직접 찍고 분류한 mclear 기록 | 약 15만 건 |
| 무게 검증 데이터 | 저울 측정 + 사진 매칭 | 약 3만 건 |
| 부피·면적 검증 | 마대 사진·드론 영상 | 약 8천 건 |
같은 종류의 데이터가 전 세계 어디에도 없다. NOAA Marine Debris Program 은 미국 권역 중심, GBIF·OBIS 는 생물 다양성 중심이라 인공 쓰레기 라벨 부족, ICC 글로벌 은 카드 분류 기록만 — 사진 라벨링 데이터셋 부족.
한국 해변에서 한국 시민이 한국 단어로 분류한 15만 건 — 이게 우리만의 데이터다. 이것을 학습 셋으로 쓴 모델이 한국 해변을 가장 잘 본다.
자기 강화 cycle — 매주 자라난다
학습 모델은 정적이지 않다. 매주 일요일 cron 이 돌아간다.
1. 시민이 분류 — 한 회 정화에서 50건 ICC 분류
2. 학습 셋 누적 — 사진 + 라벨 → mclear 15만+에 더해짐
3. 모델 fine-tuning — 매월 1회 · Sonnet Vision 기반 재학습
4. 더 정확한 도구 — 다음 달 비치스캐너가 시민을 더 도움
시민이 모델을 키운다. 모델이 다시 시민을 도운다.
부산 연안 161 km — 자동 점검 시나리오
- 정기 점검 — 부산광역시 자원봉사센터 드론 월 1회 비행
- 시민 산책 영상 — 1분 업로드로 핫스팟 감지
- 모임 사전 답사 — 호스트 정화 동선 자동 최적화
- 사후 보고 — 정화 전후 비교 자동 시각화
- 태풍 후 긴급 점검 — 폭우·태풍 후 24시간 내 적치 변화
시민이 만든 데이터가 시민에게 돌아온다 — 더 똑똑한 도구의 형태로.
---
전문: docs/모두의반려해변/송고기사_부산_260601/15_비치스캐너_15만건학습모델로_해변영상을읽는다.md
송고 패키지: 모두의 반려해변 / 사단법인 이타서울 · CC BY-NC 4.0