미토스급 AI 모델 일반에 공개…앤트로픽, 페이블5 출시

1 hour ago 1

기업공개(IPO)를 앞둔 앤트로픽이 그간 공개를 미뤄왔던 최상위급 '미토스' 수준의 인공지능(AI) 모델을 일반에 내놨다. 그간 우려 대상이었던 사이버 보안 등 민감 분야 악용을 막기 위해 안전 장치를 도입했다.

앤트로픽은 미토스급 모델을 일반용으로 안전하게 다듬은 AI 모델 '클로드 페이블5'와 보안 특화 모델 '클로드 미토스5'를 출시한다고 9일(현지시간) 밝혔다.

앤트로픽은 '페이블'의 어원은 라틴어 파불라(fabula)로, 신화를 뜻하는 '미토스'와 유사한 뜻이라고 소개했다.

두 모델은 사실상 같은 모델이지만, 페이블5는 악용 위험이 큰 분야에 안전 장치를 건 것이 특징이다.

페이블5는 악의적 해커의 악용이 우려되는 사이버 보안 분야 질의(프롬프트)가 들어오면 해당 응답을 바로 아랫단계 모델이자 최근까지 최상위 모델이었던 '오퍼스4.8'이 대신 처리하고 이용자에게 해당 사실을 알린다.

앤트로픽은 “모델을 안전하고 신속하게 출시하기 위해 이러한 안전장치를 보수적으로 조정했다”며 “이 때문에 무해한 요청이 차단되는 경우도 있지만, 평균적으로 전체 세션의 5% 미만에서만 발동된다”고 설명했다.

이와 같은 안전장치는 사이버 보안 외에도 생물무기 등에 악용될 수 있는 생물학·화학 관련 질의와 경쟁 AI 모델의 기능을 추출하는 이른바 무단 '증류'로 의심되는 질의에도 적용된다.

이와 같은 제한이 없는 미토스5는 보안 협의체 '프로젝트 글래스윙'을 통해 검증된 기관에만 선별적으로 제공된다.

이에 따라 해당 프로젝트에 참여하는 것으로 알려진 삼성전자와 SK하이닉스, SK텔레콤, 한국인터넷진흥원(KISA) 등도 해당 모델 접속권을 받을 것으로 보인다.

앤트로픽은 페이블·미토스 모델에서 발생하는 데이터를 30일간 보존해 새로운 공격을 방어하거나 오탐을 식별하는 작업에 사용하는 새로운 데이터 정책을 마련했다.

앤트로픽의 새 모델은 두 달 전 공개했던 '미토스 미리보기'보다도 더 뛰어난 성능지표(벤치마크)를 기록했다.

사이버보안 관련 능력을 측정하는 '익스플로잇벤치' 평가에서 미토스5는 78%의 점수를 받아 34%에 머무른 오픈AI의 GPT-5.5나 40% 수준인 자사 오퍼스4.8은 물론 미토스 미리보기(69%)보다도 높은 성능을 내보였다.

분야별 박사급 지능을 재는 '인류의 마지막 시험'(HLE)에서도 59%(도구 미사용 기준)를 기록, 처음으로 50% 벽을 넘은 미토스 미리보기(56.8%)를 능가했다.

터미널 환경 코딩 작업 능력을 보는 '터미널-벤치 2.1'에서도 88%를 기록해 GPT-5.5(83.4%)를 뛰어넘었다.

그러나 페이블5에서는 안전장치가 적용돼 이와 같은 성능을 체감할 수 없다.

다만 일반적인 코딩 능력을 측정하는 'SWE-벤치 프로' 성능도 80.3%로 GPT-5.5(58.6%)나 구글 제미나이3.1 프로(54.2%)를 압도했고, 지식업무 능력을 평가하는 'GDPval-AA'에서도 1932점으로 GPT-5.5(1769점)·제미나이3.1프로(1314점)보다 높은 점수를 보였다.

페이블5는 이날부터 사용 가능하고 오는 22일까지는 현행 유료 구독자에 추가 비용 없이 제공되지만, 이후에는 별도 요금을 내야만 쓸 수 있다.

앤트로픽은 서버 용량이 충분히 확보되면 페이블5를 다시 기존 구독에 포함시킬 계획이라고 안내했다.

정현정 기자 iam@etnews.com

Read Entire Article