나는 내 인생 전체를 하나의 데이터베이스에 담았다

2 weeks ago 9

  • 2019년부터 개인 생활의 모든 데이터를 수집·시각화해온 프로젝트로, 운동·수면·기분·위치·날씨 등 100여 가지 항목을 매일 기록
  • 38만 개의 데이터 포인트를 축적했으며, RescueTime·Foursquare Swarm·Apple Health 등 다양한 소스와 수작업 입력을 결합
  • 모든 데이터는 Postgres 기반 단일 데이터베이스에 저장되고, Ruby·JavaScript·Plotly로 시각화되어 공개
  • 프로젝트는 MIT 오픈소스로 공개되어 있으며, 개인 서버에서 완전 자가 호스팅 형태로 운영
  • 3년간의 실험 끝에 자체 구축의 효용은 제한적이라 결론 내렸지만, 자기 인식과 데이터 주권의 중요성을 체감한 사례로 남음

프로젝트 개요

  • 2019년부터 3년간 자신의 삶 전반의 지표를 정량화해온 개인 데이터 프로젝트
    • 하루 100개 이상의 항목을 기록하며, 피트니스·영양·사회생활·컴퓨터 사용·날씨 등을 포함
    • 총 38만 개의 데이터 포인트를 수집
  • 주요 데이터 소스
    • RescueTime: 웹사이트·앱 사용 기록 149,466건
    • Foursquare Swarm: 위치·방문 장소 126,285건
    • 수작업 입력: 기분·수면·건강·식습관 등 67,031건
    • Weather API: 날씨 데이터 15,442건
    • Apple Health: 걸음 수 3,048건

데이터베이스 구조와 기술 구성

  • 모든 데이터는 Postgres 기반 타임스탬프형 키-값 구조로 저장
    • 각 행은 timestamp, key, value로 구성
    • 시간대 차이를 고려해 날짜별로 자동 태깅하는 스크립트 작성
  • 데이터 입력
    • Telegram 봇을 통해 하루 여러 차례 질문에 응답
    • 락다운 기간, 운동 시즌 등은 기간 단위로 입력
  • 시각화 도구
    • Ruby·JavaScript·Plotly를 이용해 자체 분석 계층 구축
    • 48개의 그래프를 공개용으로 선택, 스냅샷 형태로 표시

주요 데이터 인사이트

  • 기분과 행동의 상관관계
    • 행복·흥분 상태일 때 명상 확률 44%↑, 독서·오디오북 28%↑, 음주 31%↑
  • 수면과 컨디션
    • 8.5시간 이상 수면 시 두통·감기 증상 확률 증가, 에너지 24%↓
  • 운동·체중 변화
    • 2020년 8월부터 ‘린 벌크’ 시작, 체중 +8.5kg, 안정시 심박수 +9bpm
    • 2014년 69kg → 2021년 89.8kg으로 증가
  • 위치·이동 패턴
    • 2016–17 샌프란시스코, 2018–19 뉴욕, 2020–21 빈 거주
    • 코로나19 이후 비행 횟수 급감, 락다운 영향 뚜렷
  • 기후와 생활 습관
    • 여름에는 걸음 수 33%↑, 음주 23%↑, 질병 40%↓
    • 겨울에는 온라인 쇼핑 100%↑, 감기 증상 45%↑

개인화된 데이터 활용 예시

  • Air Quality: 빈 자택의 방별 CO₂ 농도 측정, 침실 환기 문제 확인
  • Spotify 기록: 2013년 이후 48만 분(334일) 음악 청취, 20만 곡 중 49% 완청
  • Instagram Stories: 3년간 1,906개 게시, 팬데믹 기간 감소
  • GitHub 활동: fastlane(2014–2018) 이후 FxLifeSheet 등 개인 프로젝트 지속
  • 투자 관리: 2주마다 자산 분포 추적 및 시뮬레이션 수행

프라이버시와 오픈소스 철학

  • 모든 데이터는 본인 소유 서버에 저장, 외부 서비스와 연결되지 않음
  • 공개된 그래프는 개인 정보 노출이 없는 형태로 제한
  • “대기업이 이미 보유한 데이터를 개인도 직접 소유해야 한다”는 관점 강조
  • FxLifeSheet는 MIT 라이선스로 공개되어 누구나 수정·활용 가능

결론 및 2025년 업데이트

  • 3년간의 실험 결과, 직접 구축한 시스템은 시간 대비 효용이 낮음
    • 기대했던 만큼 놀라운 인사이트는 적었음
    • 그러나 자기 인식과 데이터 주권의 가치를 체험
  • 향후에는 기분 등 핵심 지표만 최소한으로 추적 예정
  • 2025년 현재 데이터 수집은 중단했으나, 웹사이트는 계속 유지 예정

Read Entire Article