ISBN의 위험성

1 month ago 11

  • 영화 기록 플랫폼 Letterboxd의 단순하고 직관적인 경험을 책에도 적용하려는 시도에서, GoodReads와 Storygraph의 복잡한 인터페이스가 문제로 지적됨
  • 책 검색 기능을 구현하려다 Google Books API가 동일한 작품의 여러 ISBN 버전을 각각 다른 항목으로 반환하는 문제를 발견
  • 이는 서지학적 구조(FRBR 모델) 에서 ‘작품(work)’과 ‘표현(expression)’, ‘형태(manifestation)’가 구분되기 때문이며, 사용자는 단순히 ‘책을 읽었다’는 사실만 기록하고 싶어도 데이터가 세분화되어 있음
  • OpenLibrary가 ‘작품’ 중심의 데이터 구조를 제공하지만, 여전히 중복과 불완전성이 존재해 완전한 대안이 되지 못함
  • 영화 데이터베이스 TMDB처럼 책 분야에는 고품질의 공개 메타데이터 인프라가 부재하며, 이는 책 중심 소셜 플랫폼 개발의 주요 장애 요인임

Letterboxd와 책 플랫폼의 비교

  • Letterboxd는 깔끔한 인터페이스비침해적 소셜 기능으로 영화 감상 기록을 쉽게 관리할 수 있음
    • 사용자는 시청한 영화와 시점을 간단히 기록 가능
  • 반면 GoodReads는 복잡한 UI와 다단계 클릭 구조로 인해 책 기록이 불편함
    • ‘읽은 책’, ‘읽을 책’이 한 화면에 섞여 있으며, 독서 챌린지·뉴스레터 등 부가 요소가 공간을 차지
  • Storygraph 역시 유사한 문제를 가지고 있어, 사용자는 결국 Obsidian 파일로 개인 기록을 관리하게 됨

Google Books API와 ISBN 문제

  • 책 검색 기능을 만들기 위해 Google Books API를 사용했으나, 동일한 작품이 여러 ISBN으로 중복 검색되는 현상 발생
    • 예시로 “The Last Unicorn”을 검색하면 하드커버, 페이퍼백, eBook, 개정판 등이 각각 다른 ISBN으로 반환됨
  • 각 ISBN은 서로 다른 판형이나 판본을 의미하지만, 사용자는 단순히 ‘책을 읽었다’는 사실만 기록하고 싶음
  • 이러한 구조는 검색 및 데이터 통합을 어렵게 만들어, 단일 작품 단위의 기록 시스템 구축에 부적합함

FRBR 모델과 ‘작품’ 단위 접근

  • 도서관학에서 사용하는 FRBR 모델은 ‘작품(work)’, ‘표현(expression)’, ‘형태(manifestation)’, ‘개별 아이템(item)’으로 구분
    • Google Books는 주로 ‘표현’ 또는 ‘형태’ 수준의 데이터를 반환
    • 사용자는 ‘작품’ 수준의 추상적 단위를 필요로 함
  • OpenLibrary는 ‘작품’ 중심의 데이터 구조를 제공하지만, 여전히 중복된 항목이 존재
    • 예: Yoko Ogawa의 Hotel Iris 검색 시 동일 작품이 네 번 중복 표시

데이터 품질과 생태계의 한계

  • LetterboxdThe Movie Database (TMDB) 를 기반으로 작동하며, TMDB는 약 100만 개 영화 데이터를 보유
  • 반면 OpenLibrary4천만 개 이상의 작품을 포함하지만, 불완전하고 정제되지 않은 데이터가 많음
  • 영화 데이터는 상업적 플랫폼과 커뮤니티 기여가 결합되어 품질이 높지만, 책 데이터는 규모가 크고 자금 지원이 부족
  • 이로 인해 책 중심의 Letterboxd형 서비스를 만들기 위한 기반 데이터가 부재

결론 및 향후 시도

  • 완전한 오픈소스 도서 메타데이터 인프라가 존재하지 않아, 책 기록 플랫폼 개발은 영화보다 훨씬 어려운 과제임
  • 저자는 여전히 독립적인 책 기록 시스템 구축을 시도할 의지를 밝힘
  • 글의 말미에서, 영화 취향을 찾는 경험처럼 책 기록도 개인화된 접근이 필요함을 암시함

Read Entire Article