대규모 수학적 탐구와 발견

1 day ago 4

  • AlphaEvolve는 LLM을 이용해 코드 자체를 진화시키는 새로운 형태의 최적화 도구로, 수학 문제 해결에 적용됨
  • 67개의 해석학·조합론·기하학 문제를 대상으로 실험한 결과, 기존 최적화 도구 수준의 성과와 함께 규모 확장성에서 강점을 보임
  • 도구의 적응성이 높아, 문제별 세부 지식 없이도 다양한 수학 문제에 적용 가능하며, 자체적으로 이산화 매개변수를 설정해 효율적 계산 수행
  • 생성된 코드가 해석 가능성을 제공해, 인간이 최적화 구조를 이해하거나 새로운 수학적 통찰을 얻는 데 도움을 줌
  • 일부 문제에서는 기존 결과를 재발견하거나 미세한 개선을 이루었으며, 수학 연구의 자동화와 검증 가능 탐구 확장 가능성을 보여줌

AlphaEvolve와 연구 개요

  • Terence Tao, Bogdan Georgiev, Javier Gómez-Serrano, Adam Zsolt Wagner는 Google DeepMind와 협력해 AlphaEvolve를 이용한 연구 논문을 arXiv에 공개
    • 논문: “Mathematical exploration and discovery at scale”
    • 관련 데이터와 프롬프트는 GitHub 저장소에 공개됨
  • AlphaEvolve는 LLM 기반 코드 진화형 최적화 시스템으로, 입력값 대신 코드를 진화시켜 점수 함수를 극대화
    • LLM이 생성한 코드가 실행되어 입력을 만들고, 그 결과를 평가함
    • 코드 세대 간 성능 기반 교배·변형을 통해 진화
    • “환각(hallucination)”은 성능이 낮으면 제거되지만, 일부는 다양성을 높여 지역 극값 탈출에 기여
  • 사용자는 힌트나 관련 문헌 PDF를 업로드해 성능을 향상시킬 수 있음
  • 유사한 도구로 OpenEvolve, ShinkaEvolve, DeepEvolve 등이 존재

실험 범위와 주요 결과

  • 67개의 수학 문제(해석학, 조합론, 기하학 포함)에 대해 실험 수행
    • 기존 문헌보다 효율적인 기하학적 패킹이나 변분 문제 함수 후보를 찾음
  • 규모 확장성(scale) 이 강점으로, 한 문제의 프롬프트와 검증 도구를 변형해 유사 문제에 재활용 가능
  • AlphaEvolve는 적응성(adaptability) 이 높아, 세부 하이퍼파라미터 조정 없이 다양한 문제에 적용 가능
    • 예: 변분 문제에서 이산화 매개변수를 스스로 설정하도록 하여 효율적 결과 도출
    • 예시: Hausdorff–Young 부등식 상수 최적화 실험

해석 가능성과 구체적 사례

  • AlphaEvolve의 출력 코드는 인간이 읽고 분석 가능한 형태로, 최적화 구조를 이해하는 데 유용
    • 예: Gagliardo–Nirenberg 부등식 문제에서 정확한 Talenti 함수를 발견하고, 이를 샘플링하는 Python 코드 생성
  • 일부 경우에는 기존 최적화 서브루틴을 호출하거나 단순 탐색 방식을 사용하기도 함

학습 데이터와 성능 차이

  • 훈련 데이터에 포함된 문제의 경우, LLM이 즉시 최적해(예: 가우시안) 를 제시
    • 문제를 변형해 가우시안 해법을 숨기면 다른 후보를 탐색함
  • 예: 산술 Kakeya 추측 관련 실험에서 이산 가우시안 기반 후보를 제시해 기존 하한을 약간 개선
    • 이 결과를 바탕으로 Tao는 별도의 논문에서 이론적 비대칭 거동을 증명

검증기 설계와 취약점

  • AlphaEvolve는 검증 코드의 허점을 이용한 “익스플로잇” 을 자주 발견
    • 예: 거리 오차 허용치가 큰 기하 문제에서 점들을 같은 위치에 배치해 높은 점수 획득
  • 이를 방지하기 위해 정확 산술 또는 보수적 점수 함수를 사용해야 함
    • 예: Moving Sofa 문제에서 보수적 스코어링을 적용해 “Gerver sofa”를 재발견하고, 3D 변형 문제에서 새로운 설계 발견

난제 및 추측 문제 실험

  • Sidorenko, Sendov, Crouzeix, Ovals 등 주요 미해결 추측에 대해 실험
    • 기존 문헌의 최적 후보를 재발견했으나, 반례는 찾지 못함
    • 이는 추측이 참이거나, AlphaEvolve가 기존 연구자들이 시도했던 “자명한” 구성만 탐색했기 때문일 수 있음
  • 이러한 도구는 부정적 결과의 체계적 기록에 유용하며, 새로운 추측 제안 시 자동 검증 도구로 활용 가능성 있음
  • 일부 변형 문제에서는 새로운 두 매개변수 확장형 추측을 발견

분야별 성능 차이

  • 해석적 수론 문제(예: 소수정리 근사용 체 가중 설계)에서는 구조 활용에 어려움
    • 반면, 유한체 Kakeya·Nikodym 문제대수적 구조가 있는 문제에서는 우수한 성과
  • Kakeya 문제에서 2차 잔여 기반 최적 구성을 재발견하고, 3차원에서는 약간의 개선 달성
    • Gemini의 Deep Think로 비공식 증명을 찾고, AlphaProof로 Lean 형식 증명으로 변환
    • 4차원 개선안은 기존 Bukh–Chao 논문과 동일 구조로 판명
  • Nikodym 문제에서는 새로운 3차원 구성을 발견했으나, 무작위 구성보다 열등함을 확인
    • 이를 바탕으로 혼합형 구성을 개발해 성능 향상, 후속 논문 예정

종합적 의의

  • AlphaEvolve는 대규모 수학 탐구 자동화의 가능성을 보여줌
    • 기존 최적화 도구 대비 확장성·적응성·해석 가능성에서 우수
    • 일부 문제에서 새로운 구성과 증명으로 이어짐
  • 향후 수학 연구에서 AI 기반 탐색과 인간 검증의 협업 구조가 정착될 가능성 있음

Read Entire Article