ISBN의 위험성

1 month ago 11

영화 기록 플랫폼 Letterboxd의 단순하고 직관적인 경험을 책에도 적용하려는 시도에서, GoodReads와 Storygraph의 복잡한 인터페이스가 문제로 지적됨
책 검색 기능을 구현하려다 Google Books API가 동일한 작품의 여러 ISBN 버전을 각각 다른 항목으로 반환하는 문제를 발견
이는 서지학적 구조(FRBR 모델) 에서 ‘작품(work)’과 ‘표현(expression)’, ‘형태(manifestation)’가 구분되기 때문이며, 사용자는 단순히 ‘책을 읽었다’는 사실만 기록하고 싶어도 데이터가 세분화되어 있음
OpenLibrary가 ‘작품’ 중심의 데이터 구조를 제공하지만, 여전히 중복과 불완전성이 존재해 완전한 대안이 되지 못함
영화 데이터베이스 TMDB처럼 책 분야에는 고품질의 공개 메타데이터 인프라가 부재하며, 이는 책 중심 소셜 플랫폼 개발의 주요 장애 요인임

Letterboxd와 책 플랫폼의 비교

Letterboxd는 깔끔한 인터페이스와 비침해적 소셜 기능으로 영화 감상 기록을 쉽게 관리할 수 있음
- 사용자는 시청한 영화와 시점을 간단히 기록 가능
반면 GoodReads는 복잡한 UI와 다단계 클릭 구조로 인해 책 기록이 불편함
- ‘읽은 책’, ‘읽을 책’이 한 화면에 섞여 있으며, 독서 챌린지·뉴스레터 등 부가 요소가 공간을 차지
Storygraph 역시 유사한 문제를 가지고 있어, 사용자는 결국 Obsidian 파일로 개인 기록을 관리하게 됨

책 검색 기능을 만들기 위해 Google Books API를 사용했으나, 동일한 작품이 여러 ISBN으로 중복 검색되는 현상 발생
- 예시로 “The Last Unicorn”을 검색하면 하드커버, 페이퍼백, eBook, 개정판 등이 각각 다른 ISBN으로 반환됨
각 ISBN은 서로 다른 판형이나 판본을 의미하지만, 사용자는 단순히 ‘책을 읽었다’는 사실만 기록하고 싶음
이러한 구조는 검색 및 데이터 통합을 어렵게 만들어, 단일 작품 단위의 기록 시스템 구축에 부적합함

도서관학에서 사용하는 FRBR 모델은 ‘작품(work)’, ‘표현(expression)’, ‘형태(manifestation)’, ‘개별 아이템(item)’으로 구분
- Google Books는 주로 ‘표현’ 또는 ‘형태’ 수준의 데이터를 반환
- 사용자는 ‘작품’ 수준의 추상적 단위를 필요로 함
OpenLibrary는 ‘작품’ 중심의 데이터 구조를 제공하지만, 여전히 중복된 항목이 존재
- 예: Yoko Ogawa의 Hotel Iris 검색 시 동일 작품이 네 번 중복 표시

Letterboxd는 The Movie Database (TMDB) 를 기반으로 작동하며, TMDB는 약 100만 개 영화 데이터를 보유
반면 OpenLibrary는 4천만 개 이상의 작품을 포함하지만, 불완전하고 정제되지 않은 데이터가 많음
영화 데이터는 상업적 플랫폼과 커뮤니티 기여가 결합되어 품질이 높지만, 책 데이터는 규모가 크고 자금 지원이 부족함
이로 인해 책 중심의 Letterboxd형 서비스를 만들기 위한 기반 데이터가 부재