- 2019년부터 개인 생활의 모든 데이터를 수집·시각화해온 프로젝트로, 운동·수면·기분·위치·날씨 등 100여 가지 항목을 매일 기록
- 약 38만 개의 데이터 포인트를 축적했으며, RescueTime·Foursquare Swarm·Apple Health 등 다양한 소스와 수작업 입력을 결합
- 모든 데이터는 Postgres 기반 단일 데이터베이스에 저장되고, Ruby·JavaScript·Plotly로 시각화되어 공개
- 프로젝트는 MIT 오픈소스로 공개되어 있으며, 개인 서버에서 완전 자가 호스팅 형태로 운영
- 3년간의 실험 끝에 자체 구축의 효용은 제한적이라 결론 내렸지만, 자기 인식과 데이터 주권의 중요성을 체감한 사례로 남음
프로젝트 개요
- 2019년부터 3년간 자신의 삶 전반의 지표를 정량화해온 개인 데이터 프로젝트
- 하루 100개 이상의 항목을 기록하며, 피트니스·영양·사회생활·컴퓨터 사용·날씨 등을 포함
- 총 38만 개의 데이터 포인트를 수집
- 주요 데이터 소스
-
RescueTime: 웹사이트·앱 사용 기록 149,466건
-
Foursquare Swarm: 위치·방문 장소 126,285건
-
수작업 입력: 기분·수면·건강·식습관 등 67,031건
-
Weather API: 날씨 데이터 15,442건
-
Apple Health: 걸음 수 3,048건
데이터베이스 구조와 기술 구성
- 모든 데이터는 Postgres 기반 타임스탬프형 키-값 구조로 저장
- 각 행은 timestamp, key, value로 구성
- 시간대 차이를 고려해 날짜별로 자동 태깅하는 스크립트 작성
-
데이터 입력
- Telegram 봇을 통해 하루 여러 차례 질문에 응답
- 락다운 기간, 운동 시즌 등은 기간 단위로 입력
-
시각화 도구
- Ruby·JavaScript·Plotly를 이용해 자체 분석 계층 구축
- 48개의 그래프를 공개용으로 선택, 스냅샷 형태로 표시
주요 데이터 인사이트
-
기분과 행동의 상관관계
- 행복·흥분 상태일 때 명상 확률 44%↑, 독서·오디오북 28%↑, 음주 31%↑
-
수면과 컨디션
- 8.5시간 이상 수면 시 두통·감기 증상 확률 증가, 에너지 24%↓
-
운동·체중 변화
- 2020년 8월부터 ‘린 벌크’ 시작, 체중 +8.5kg, 안정시 심박수 +9bpm
- 2014년 69kg → 2021년 89.8kg으로 증가
-
위치·이동 패턴
- 2016–17 샌프란시스코, 2018–19 뉴욕, 2020–21 빈 거주
- 코로나19 이후 비행 횟수 급감, 락다운 영향 뚜렷
-
기후와 생활 습관
- 여름에는 걸음 수 33%↑, 음주 23%↑, 질병 40%↓
- 겨울에는 온라인 쇼핑 100%↑, 감기 증상 45%↑
개인화된 데이터 활용 예시
-
Air Quality: 빈 자택의 방별 CO₂ 농도 측정, 침실 환기 문제 확인
-
Spotify 기록: 2013년 이후 48만 분(334일) 음악 청취, 20만 곡 중 49% 완청
-
Instagram Stories: 3년간 1,906개 게시, 팬데믹 기간 감소
-
GitHub 활동: fastlane(2014–2018) 이후 FxLifeSheet 등 개인 프로젝트 지속
-
투자 관리: 2주마다 자산 분포 추적 및 시뮬레이션 수행
프라이버시와 오픈소스 철학
- 모든 데이터는 본인 소유 서버에 저장, 외부 서비스와 연결되지 않음
- 공개된 그래프는 개인 정보 노출이 없는 형태로 제한
- “대기업이 이미 보유한 데이터를 개인도 직접 소유해야 한다”는 관점 강조
-
FxLifeSheet는 MIT 라이선스로 공개되어 누구나 수정·활용 가능
결론 및 2025년 업데이트
- 3년간의 실험 결과, 직접 구축한 시스템은 시간 대비 효용이 낮음
- 기대했던 만큼 놀라운 인사이트는 적었음
- 그러나 자기 인식과 데이터 주권의 가치를 체험
- 향후에는 기분 등 핵심 지표만 최소한으로 추적 예정
- 2025년 현재 데이터 수집은 중단했으나, 웹사이트는 계속 유지 예정