잘못된 설계
처음에 우리는 이렇게 설계했다.
패드 탭: 정밀도 30%
음성 이름: 정밀도 40%
음성 비유: 정밀도 60%
저울 실측: 정밀도 95%
"앱으로 탭하면 저품질 데이터?" — 이 숫자를 보면 그렇게 읽힌다.
왜 틀렸나
분류와 무게는 다른 차원이다.
앱으로 "스티로폼 부표"를 탭하면 — 사용자가 눈으로 보고 확인한 ICC 분류다. 이것은 저울로 잴 수 없다. 저울은 무게를 알려주지, 그게 스티로폼인지 플라스틱인지는 모른다.
반대로, 저울은 무게를 정확하게 알려준다. 하지만 그게 뭔지는 사용자가 말해야 한다.
앱 분류 = 핵심 데이터. 저울 = 보너스 차원.
올바른 설계
분류 (classifyMethod)
음성 / AI / 패드 / 확인 → 전부 동등하게 정확
무게 (weightMethod)
저울 / 직접 cm / 비유 / 기본값 → 이것만 정밀도 차이
두 차원을 하나의 퍼센트에 합치면 앱 기록이 폄하된다. 분리해야 한다.
라벨은 이렇게 표시한다
"ICC 앱기록" — 분류는 항상 이것. 자랑이다.
"무게: 비유 추정" 또는 "무게: 저울 실측" — 무게만 방법을 표시한다.
정직은 정밀보다 강하다
OSPAR(유럽 해양 모니터링)는 2010년 데이터를 2021년 분류로 소급 변환하지 않는다. 원본 코드를 보존한 채 정합 코드를 병기한다.
우리도 같은 원칙이다. v2.0에서 기타(idx=19)로 분류된 1만 2천 건은 잘못된 데이터가 아니다. 25종 체계로 분류할 수 없었던 항목을 정직하게 기타로 기록한 것이다.
정확하지 않은 것을 정확한 척하는 것보다, 정직하게 기록하고 투명하게 공유하는 것이 더 강한 신뢰를 만든다.