-
AlphaEvolve는 LLM을 이용해 코드 자체를 진화시키는 새로운 형태의 최적화 도구로, 수학 문제 해결에 적용됨
- 67개의 해석학·조합론·기하학 문제를 대상으로 실험한 결과, 기존 최적화 도구 수준의 성과와 함께 규모 확장성에서 강점을 보임
- 도구의 적응성이 높아, 문제별 세부 지식 없이도 다양한 수학 문제에 적용 가능하며, 자체적으로 이산화 매개변수를 설정해 효율적 계산 수행
- 생성된 코드가 해석 가능성을 제공해, 인간이 최적화 구조를 이해하거나 새로운 수학적 통찰을 얻는 데 도움을 줌
- 일부 문제에서는 기존 결과를 재발견하거나 미세한 개선을 이루었으며, 수학 연구의 자동화와 검증 가능 탐구 확장 가능성을 보여줌
AlphaEvolve와 연구 개요
-
Terence Tao, Bogdan Georgiev, Javier Gómez-Serrano, Adam Zsolt Wagner는 Google DeepMind와 협력해 AlphaEvolve를 이용한 연구 논문을 arXiv에 공개
- 논문: “Mathematical exploration and discovery at scale”
- 관련 데이터와 프롬프트는 GitHub 저장소에 공개됨
- AlphaEvolve는 LLM 기반 코드 진화형 최적화 시스템으로, 입력값 대신 코드를 진화시켜 점수 함수를 극대화함
- LLM이 생성한 코드가 실행되어 입력을 만들고, 그 결과를 평가함
- 코드 세대 간 성능 기반 교배·변형을 통해 진화
- “환각(hallucination)”은 성능이 낮으면 제거되지만, 일부는 다양성을 높여 지역 극값 탈출에 기여
- 사용자는 힌트나 관련 문헌 PDF를 업로드해 성능을 향상시킬 수 있음
- 유사한 도구로 OpenEvolve, ShinkaEvolve, DeepEvolve 등이 존재
실험 범위와 주요 결과
- 67개의 수학 문제(해석학, 조합론, 기하학 포함)에 대해 실험 수행
- 기존 문헌보다 효율적인 기하학적 패킹이나 변분 문제 함수 후보를 찾음
-
규모 확장성(scale) 이 강점으로, 한 문제의 프롬프트와 검증 도구를 변형해 유사 문제에 재활용 가능
- AlphaEvolve는 적응성(adaptability) 이 높아, 세부 하이퍼파라미터 조정 없이 다양한 문제에 적용 가능
- 예: 변분 문제에서 이산화 매개변수를 스스로 설정하도록 하여 효율적 결과 도출
- 예시: Hausdorff–Young 부등식 상수 최적화 실험
해석 가능성과 구체적 사례
- AlphaEvolve의 출력 코드는 인간이 읽고 분석 가능한 형태로, 최적화 구조를 이해하는 데 유용
- 예: Gagliardo–Nirenberg 부등식 문제에서 정확한 Talenti 함수를 발견하고, 이를 샘플링하는 Python 코드 생성
- 일부 경우에는 기존 최적화 서브루틴을 호출하거나 단순 탐색 방식을 사용하기도 함
학습 데이터와 성능 차이
- 훈련 데이터에 포함된 문제의 경우, LLM이 즉시 최적해(예: 가우시안) 를 제시
- 문제를 변형해 가우시안 해법을 숨기면 다른 후보를 탐색함
- 예: 산술 Kakeya 추측 관련 실험에서 이산 가우시안 기반 후보를 제시해 기존 하한을 약간 개선
- 이 결과를 바탕으로 Tao는 별도의 논문에서 이론적 비대칭 거동을 증명
검증기 설계와 취약점
- AlphaEvolve는 검증 코드의 허점을 이용한 “익스플로잇” 을 자주 발견
- 예: 거리 오차 허용치가 큰 기하 문제에서 점들을 같은 위치에 배치해 높은 점수 획득
- 이를 방지하기 위해 정확 산술 또는 보수적 점수 함수를 사용해야 함
- 예: Moving Sofa 문제에서 보수적 스코어링을 적용해 “Gerver sofa”를 재발견하고, 3D 변형 문제에서 새로운 설계 발견
난제 및 추측 문제 실험
-
Sidorenko, Sendov, Crouzeix, Ovals 등 주요 미해결 추측에 대해 실험
- 기존 문헌의 최적 후보를 재발견했으나, 반례는 찾지 못함
- 이는 추측이 참이거나, AlphaEvolve가 기존 연구자들이 시도했던 “자명한” 구성만 탐색했기 때문일 수 있음
- 이러한 도구는 부정적 결과의 체계적 기록에 유용하며, 새로운 추측 제안 시 자동 검증 도구로 활용 가능성 있음
- 일부 변형 문제에서는 새로운 두 매개변수 확장형 추측을 발견
분야별 성능 차이
-
해석적 수론 문제(예: 소수정리 근사용 체 가중 설계)에서는 구조 활용에 어려움
- 반면, 유한체 Kakeya·Nikodym 문제 등 대수적 구조가 있는 문제에서는 우수한 성과
- Kakeya 문제에서 2차 잔여 기반 최적 구성을 재발견하고, 3차원에서는 약간의 개선 달성
- Gemini의 Deep Think로 비공식 증명을 찾고, AlphaProof로 Lean 형식 증명으로 변환
- 4차원 개선안은 기존 Bukh–Chao 논문과 동일 구조로 판명
- Nikodym 문제에서는 새로운 3차원 구성을 발견했으나, 무작위 구성보다 열등함을 확인
- 이를 바탕으로 혼합형 구성을 개발해 성능 향상, 후속 논문 예정
종합적 의의
- AlphaEvolve는 대규모 수학 탐구 자동화의 가능성을 보여줌
- 기존 최적화 도구 대비 확장성·적응성·해석 가능성에서 우수
- 일부 문제에서 새로운 구성과 증명으로 이어짐
- 향후 수학 연구에서 AI 기반 탐색과 인간 검증의 협업 구조가 정착될 가능성 있음