메타가 천문학적인 자금을 들여 설립한 인공지능(AI) 연구조직 ‘메타초지능연구소(MSL)’가 9개월 만에 첫 결과물을 내놨다. 8일(현지시간) 메타는 이 회사의 첫 폐쇄형 AI모델 ‘뮤즈 스파크’를 공개했다.
뮤즈 스파크는 모델을 비공개로 전환할 만큼의 성능을 입증했다. 수학·물리·화학 등 각 분야 전문가 수준의 문제 2500개를 맞히는 ‘인류의 마지막 시험(HLE)’에서 42.8%의 정답률을 기록해 구글 제미나이3.1프로(45.4%), 오픈AI GPT-5.4(43.9%) 등 정상급 모델들과 어깨를 나란히 했다. 뮤즈 스파크에는 여러 AI에이전트가 병렬적으로 추론해 답변을 개선하는 ‘숙고(contemplation)’ 기능도 있는데, 이를 쓰면 HLE 정답률은 50.2%로 높아진다.
의료 추론 능력은 다른 AI모델을 앞질렀다. 의사와 환자 간 대화 5000건을 바탕으로 의료 지식을 평가하는 ‘헬스벤치 하드’ 성능 지표에서 뮤즈 스파크는 GPT-5.4(40.1점), 제미나이3.1프로(20.6점), 앤스로픽 오퍼스 4.6(14.8점)보다 높은 42.8점을 기록했다. 1000명이 넘는 의사와 협력해 학습 데이터를 구축한 결과다. 다만 코딩 능력을 측정하는 ‘SWE-벤치 프로’, ‘터미널-벤치 2.0’ 등 지표에서는 타사 대비 저조한 성과를 냈다. 앤스로픽 클로드 코드, 오픈AI 코덱스 등이 터미널(개발자 작업창)에 직접 연동되는 데 비해 뮤즈 스파크는 챗봇 형태로만 작동한다는 점도 한계로 지목된다.
메타는 뮤즈 스파크를 통해 AI모델 경쟁에 다시 뛰어들 발판을 마련했다. 메타가 2024년 출시한 라마4는 그간 구글·오픈AI 등은 물론 중국산 모델보다 성능이 뒤처졌다는 평가를 받았다. 저커버그 최고경영자(CEO·사진)는 AI 데이터 분류기업 스케일AI를 148억달러(약 22조원)에 인수해 CEO인 알렉산데르 왕을 메타 AI부문 총책임자로 앉히고, 구글 딥마인드·오픈AI 등 핵심 연구원에게 직접 이메일을 보내며 인재 확보에 나섰다.
뮤즈 스파크를 사전에 사용해 본 라얀 크리슈난 발스AI CEO는 “이 같은 발전 속도가 유지된다면 머지않아 최첨단 모델을 내놓을 것”이라며 “메타는 경쟁력 있는 연구소로 거듭났다”고 평가했다.
실리콘밸리=김인엽 특파원 inside@hankyung.com

2 days ago
3


!["한바퀴 돌렸는데 이게 돼?"…SNS 달구는 '갤S26 대박 기능' [테크로그]](https://img.hankyung.com/photo/202604/01.43509100.1.jpg)

!['지구↔달' 유인 비행 아르테미스…해냈다 [지금은 우주]](https://image.inews24.com/v1/0cd3a197e1c9c5.jpg)












English (US) ·