-
OpenAI 연구원이 GPT-5가 해결했다고 주장한 Erdős 문제 관련 발표가 커뮤니티와 업계 인물들에게서 비판을 받자 곧 철회됨
- 해당 주장은 수십 년간 미해결로 여겨진 수학 난제의 실질적 증명을 AI가 독립적으로 찾아냈다는 의미로 해석될 수 있는 표현 사용
- 사실상 GPT-5는 기존 연구를 재발견해 보여준 수준이었으며, 진짜 미해결 문제에 대한 새로운 해법 제시가 아니었음
- 이 사건은 OpenAI의 신뢰성 저하와 검증되지 않은 AI 성과 과장 발표에 대한 업계 우려를 키우는 계기임
- 실제로 GPT-5의 강점은 연구 논문 탐색 및 문헌 정리 도우미 역할에 있다는 점이 강조됨
사건 개요
- 최근 OpenAI 연구원이 X(구 Twitter)에서 GPT-5가 "10개의 미해결 Erdős 문제 해결" 및 11개 문제 추가 진전이라는 획기적 성과를 발표함
- 이 주장은 GPT-5가 어려운 정수론 문제에 대한 수학적 증명을 독립적으로 도출했다는 취지로 받아들여짐
- 여러 OpenAI 연구원이 유사한 내용의 게시글을 올려, 이 AI가 혁신적인 과학적 발견을 실현할 수 있음을 암시함
커뮤니티의 검증과 논란
-
Erdosproblems.com 사이트를 운영하는 수학자 Thomas Bloom이 바로 반박하며, 사이트에서 "open"으로 표기한 문제는 실제로 미해결 문제가 아니라고 설명함
- 해당 문제들은 단순히 Bloom 본인이 답을 몰랐거나 기존 연구를 확인하지 못했던 사례임
-
GPT-5는 이미 존재하던 연구 결과를 찾아냈을 뿐, 새로운 수학적 해법을 발견한 것이 아님
- 이 사실이 알려지자 OpenAI 연구원들은 게시글을 삭제하거나 내용을 수정함
- 커뮤니티와 주요 인사, 예를 들어 Deepmind CEO Demis Hassabis는 "민망한 일"이라 평가했고, Meta AI 담당자 Yann LeCun 역시 OpenAI가 자체 홍보에 현혹된 셈이라고 지적함
- 연구진들은 실수를 인정하고, GPT-5의 실제 역할에 대해 재설명했음
업계 신뢰 문제 및 비판
- 이 사건으로 OpenAI가 신뢰성·사실 확인 과정에서 문제를 드러냈다는 평가 확대
- 특히, AI 업계에 과장된 기대감과 관련주 투자 열기가 겹치며 검증되지 않은 성과 발표 우려가 커짐
- 왜 업계 선두 연구원들이 사실 확인 없이 극적인 주장을 공개했는지, 조직 내부 건전성에 대한 의문도 제기됨
실제 결과 및 AI의 수학 분야 역할
-
실질적으로 GPT-5는 어렵고 용어가 다양한 수학 문제에 대해 관련 논문, 연구 자료를 탐색해주는 도우미 역할로 유용성 입증
- 수학자 Terence Tao는 AI가 '최신 미해결 문제의 해법'이라기보다, 방대한 문헌 조사와 반복적 서치 작업을 크게 단축시켜줄 것으로 기대함
- 일부 독립적인 진전 사례가 존재하나, 현재로선 논문 찾기·정리 자동화 지원에 강점
- 향후 수학 분야에서 생성형 AI가 속도 향상 및 자동화에 기여할 잠재력 있음
- 하지만 전문가의 검증, 분류, 결과 통합이 필수적임
결론
- 이번 사건은 생성형 AI의 실제 한계와 산업적 가능성, 그리고 AI 연구 결과 과장 발표의 위험성을 모두 드러내는 대표적 사례임
- 결과적으로 GPT-5는 미해결 수학 문제의 혁신적 돌파구가 아니라, 연구 자료 정리에 도움을 주는 보조 도구로서의 잠재력이 강조됨