★ 가장 자주 묻는 질문 — 무게 단위
모든 무게 컬럼은 raw gram (g)입니다. 컬럼명에 _g 접미사가 붙어 있고, kg 단위로 환산하려면 /1000. 총 무게 619423 = 619.4kg.
메타데이터
세션 식별자·시각·GPS 좌표 — 모든 row 의 join·필터·시계열 키.
session_id활동 세션 고유 식별자. 한 번의 플로깅 세션 = 한 row.
10211-2포맷 {plogging_id}-{user_id}. join 키로 활용 가능.
date활동 시작 일시 (KST, UTC+9).
2025-09-15 10:43:50ISO 8601 변형. 시계열 분석 시 KST 기준.
addressGPS 좌표를 역지오코딩한 한국어 주소.
"인천 중구 을왕동"원본 GPS 정밀도는 lat·lng 컬럼 참조. 시·구·동 단위.
region주소 첫 토큰 (광역시·도). region 단위 집계 키.
인천lat위도. WGS84 기준. 원본 정밀도 그대로 (소수 4~6자리).
37.4456GPS 라운딩 적용 X — 핫스팟 분석·조류 영향 연구를 위해 정밀도 보존.
lng경도. WGS84 기준.
126.3712활동 요약
한 세션의 개수·이동 거리. GPS 신호 약한 구간은 결측.
item_count한 세션에서 기록한 개별 쓰레기 개수.
8결측 시 빈 셀. mclear 테이블 row 수와 일치.
distance_km이동 거리. GPS 트랙 기반 자동 계산.
0.31결측 시 빈 셀. GPS 신호 약한 구간은 0 또는 누락 가능.
무게 — 합계
세션별 총 무게 + 플라스틱 / 비플라스틱 분리 합산. 모두 gram.
total_weight_g총 무게. 19종 분류 합산값.
619423★ 단위 주의 — 모든 무게 컬럼은 raw gram. kg 환산 시 /1000.
plastic_weight_g플라스틱 계열 합산 (idx 0~10).
413885non_plastic_weight_g비플라스틱 합산 (idx 11~19).
205538무게 — 19종 ICC 분류
ICC(International Coastal Cleanup) 19종 + 한국 특화 카테고리. 각 컬럼명 = 한국어 명칭 + _g. 모두 raw gram 단위.
| idx | 컬럼명 | 한국어 |
|---|---|---|
| 0 | styrofoam_buoy_g | 스티로폼 부표 |
| 1 | styrofoam_container_g | 스티로폼 용기 |
| 2 | styrofoam_fragment_g | 스티로폼 조각 |
| 3 | plastic_container_g | 플라스틱 용기 |
| 4 | cap_straw_spoon_g | 뚜껑·빨대·수저 |
| 5 | plastic_fragment_g | 플라스틱 조각 |
| 6 | vinyl_bag_g | 비닐 봉투 |
| 7 | product_packaging_g | 제품 포장 |
| 8 | vinyl_fragment_g | 비닐 조각 |
| 9 | fishing_net_rope_g | 어망·밧줄 |
| 10 | packaging_band_g | 포장 끈·밴드 |
| 11 | fabric_fragment_g | 직물 조각 |
| 12 | paper_g | 종이류 |
| 13 | metal_g | 금속류 |
| 14 | wood_g | 목재 |
| 15 | cloth_fabric_g | 옷·신발 |
| 16 | glass_g | 유리류 |
| 17 | rubber_g | 고무류 |
| 18 | cigarette_butt_g | 담배꽁초 |
| 19 | other_g | 기타 |
모바일에서는 설명 컬럼이 숨겨집니다. 자세한 분류 정의는 데이터 표준 페이지의 ICC 분류 체계 섹션 참조.
라이선스
license데이터 라이선스. 모든 row 동일 — 비상업 목적 자유 사용.
CC BY-NC 4.0라이선스 케이스별 사용 가능 여부는 /protocol/opendata/citation 참조.
Quick Start
Python pandas 로 가장 흔한 분석 진입.
# 1. CSV 로드
import pandas as pd
df = pd.read_csv("caresea_opendata_full_2026-05-05.csv")
# 2. 무게 단위 변환 (gram → kg)
weight_cols = [c for c in df.columns if c.endswith("_g")]
df[weight_cols] = df[weight_cols] / 1000 # kg
# 3. 지역별 총 무게
df.groupby("region")["total_weight_g"].sum().sort_values(ascending=False)
# 4. 시계열 — 월별 스티로폼 부표 추이
df["date"] = pd.to_datetime(df["date"])
df.set_index("date").resample("M")["styrofoam_buoy_g"].sum()
인용 시: @dataset{caresea2026, license={CC BY-NC 4.0}, ...} — 인용 가이드 참조.
결측값
무게·개수·거리 컬럼은 측정 안 된 경우 빈 셀 또는 0. pandas 에서는 dtype 에 따라 NaN 또는 0 으로 로드됩니다. 무게 합계 분석 시 0 처리 권장 (CSV 출력 시 빈 row 는 0 으로 채움).
3단계 품질 검증
사진 EXIF 대조·GPS 경계 확인·통계적 이상치 탐지를 거친 row 만 본 데이터셋에 포함됩니다. 검증 통과율과 한계는 데이터 표준 페이지에서 확인할 수 있습니다.
변경 이력
ICC 분류 v2.0 (2024.09~) 기준 19종. 이전 v1.0 (2021~2024) 9종 데이터는 매핑 테이블로 호환. 새 분류 추가 시 기존 idx 보존 — 마이그레이션 없음.