- 최근 Hacker News 신규 계정의 댓글 패턴을 분석한 결과, 기존 사용자와 뚜렷한 차이가 확인됨
- 신규 계정의 댓글 중 17.47%가 EM 대시(—), 화살표 등 특수기호를 사용했으며, 기존 계정의 1.83%보다 약 10배 높음
- 또한 신규 계정은 AI와 LLM 관련 단어를 언급할 확률이 18.67%로, 기존 계정의 11.8%보다 높게 나타남
- 분석은 /newcomments와 /noobcomments 데이터를 기반으로 약 700개씩의 샘플을 비교한 결과임
- 이러한 통계는 HN 커뮤니티 내 자동화 계정(봇) 증가 가능성을 시사함
HN 댓글 내 이상 징후 관찰
- 최근 몇 달간 HN에 봇이 급증한 듯한 현상이 관찰됨
- 일부 계정은 무의미한 문자열이나 숫자만을 게시
- 예시로 “13 60 well and t6ctctfuvuh7hguhuig8h88gd…” 같은 난해한 텍스트나 “1662476506”, “Аё” 등의 단일 문자 댓글이 포함됨
- 이러한 계정 외에도 평범하지만 어색하거나 주제와 맞지 않는 댓글이 다수 존재
데이터 수집 및 분석 방법
-
/newcomments(최근 댓글)과 /noobcomments(신규 계정 댓글) 페이지를 스크래핑하여 비교 분석
- 각 그룹에서 약 700개 댓글 샘플을 수집해 단순 통계 계산 수행
주요 통계 결과
- 신규 계정 댓글의 17.47%가 EM 대시, 화살표 등 특수기호를 포함, 기존 계정의 1.83% 대비 약 10배 차이
- 신규 계정 댓글의 18.67%가 AI 또는 LLM 관련 언급을 포함, 기존 계정의 11.8%보다 높음
해석 및 의문점
- 인간 사용자도 EM 대시를 사용할 수 있으나, 신규 계정에서의 과도한 사용 비율은 설명하기 어려움
- 이러한 차이는 HN 신규 계정 중 자동 생성된 계정 존재 가능성을 암시
참고 자료