HN 신규 계정이 EM 대시를 사용할 확률이 10배 높음

4 weeks ago 11

최근 Hacker News 신규 계정의 댓글 패턴을 분석한 결과, 기존 사용자와 뚜렷한 차이가 확인됨
신규 계정의 댓글 중 17.47%가 EM 대시(—), 화살표 등 특수기호를 사용했으며, 기존 계정의 1.83%보다 약 10배 높음
또한 신규 계정은 AI와 LLM 관련 단어를 언급할 확률이 18.67%로, 기존 계정의 11.8%보다 높게 나타남
분석은 /newcomments와 /noobcomments 데이터를 기반으로 약 700개씩의 샘플을 비교한 결과임
이러한 통계는 HN 커뮤니티 내 자동화 계정(봇) 증가 가능성을 시사함

HN 댓글 내 이상 징후 관찰

최근 몇 달간 HN에 봇이 급증한 듯한 현상이 관찰됨
- 일부 계정은 무의미한 문자열이나 숫자만을 게시
- 예시로 “13 60 well and t6ctctfuvuh7hguhuig8h88gd…” 같은 난해한 텍스트나 “1662476506”, “Аё” 등의 단일 문자 댓글이 포함됨
이러한 계정 외에도 평범하지만 어색하거나 주제와 맞지 않는 댓글이 다수 존재

데이터 수집 및 분석 방법

/newcomments(최근 댓글)과 /noobcomments(신규 계정 댓글) 페이지를 스크래핑하여 비교 분석
각 그룹에서 약 700개 댓글 샘플을 수집해 단순 통계 계산 수행

주요 통계 결과

신규 계정 댓글의 17.47%가 EM 대시, 화살표 등 특수기호를 포함, 기존 계정의 1.83% 대비 약 10배 차이
- 통계적 유의성 p = 7e-20
신규 계정 댓글의 18.67%가 AI 또는 LLM 관련 언급을 포함, 기존 계정의 11.8%보다 높음
- 통계적 유의성 p = 0.0018

해석 및 의문점

인간 사용자도 EM 대시를 사용할 수 있으나, 신규 계정에서의 과도한 사용 비율은 설명하기 어려움
이러한 차이는 HN 신규 계정 중 자동 생성된 계정 존재 가능성을 암시

참고 자료

분석에 사용된 소스 코드와 데이터는 GitHub 저장소(vlofgren/hn-green-clankers)에 공개됨
Marginalia.nu는 해당 연구를 “Weird AI Crap” 시리즈의 일부로 게시함

Read Entire Article