美 정부 지시에 멈춘 클로드 최신 AI…"빠른 복구 위해 노력"

11 hours ago 4

미국 인공지능(AI) 기업 앤트로픽이 역대 최고 성능 모델로 내세운 '클로드 페이블 5(Claude Fable 5)'와 보안 특화 모델 '클로드 미토스 5(Claude Mythos 5)'의 서비스를 공개 사흘 만에 중단했다.

앤트로픽은 12일(현지시간) 공지를 통해 "미국 정부가 미국 안팎의 모든 외국 국적자에 대해 페이블 5와 미토스 5 접근을 중단하라는 지시를 내렸다"고 밝혔다. 접근 제한 대상에는 외국 국적의 앤트로픽 직원도 포함된다.

앤트로픽은 이날 오후 5시 21분(미 동부시간) 정부로부터 지시를 받았다며 "규정 준수를 위해 모든 고객의 페이블 5와 미토스 5 접근을 갑작스럽게 비활성화할 수밖에 없다"고 설명했다. 다만 다른 클로드 AI 모델 이용에는 영향이 없다고 부연했다.

이번 조치는 지난 9일 페이블 5와 미토스 5가 공개된 지 사흘 만에 나왔다. 앤트로픽은 당시 페이블 5에 대해 "일반에 공개한 모델 중 가장 높은 성능을 갖췄다"며 "복잡하고 긴 작업에서 기존 모델보다 큰 성능 우위를 보인다"고 강조했다.

특히 결제기업 스트라이프가 5000만 줄 규모 루비 코드베이스 마이그레이션을 페이블 5로 하루 만에 처리했다는 사례가 알려지며 주목을 받았다. 수작업으로 진행했다면 두 달 넘게 걸릴 작업이었다는 설명이 붙으면서 "연구원 두 달 치 일을 단 하루 만에 처리한 AI"라는 평가가 나오기도 했다.

미국 정부가 문제 삼은 지점은 '탈옥' 가능성이다. 탈옥은 AI 모델의 안전장치를 우회해 제한된 답변을 끌어내는 방식을 뜻한다. 앤트로픽에 따르면 정부가 보낸 서한에는 구체적으로 어떤 국가안보 위험이 발견됐는지는 적시되지 않았다. 다만 회사는 정부가 페이블 5에서 이런 안전장치 우회 사례가 확인됐다고 판단해 접근 중단을 지시한 것으로 보고 있다.

다만 앤트로픽은 "해당 기법이 사용된 시연을 검토한 결과 이미 알려진 소수의 경미한 취약점을 찾아낸 수준이었다"며 "이 취약점들은 비교적 단순하고, 다른 공개 모델들도 별도의 우회 없이 발견할 수 있는 것으로 확인됐다"고 주장했다.

또 출시 전 미국 정부, 영국 AI안전연구소(AISI), 외부 민간 기관, 내부 팀과 함께 총 수천 시간에 걸쳐 안전장치 레드팀 테스트를 진행했다는 게 앤트로픽 측의 설명이다.

앤트로픽은 "정부의 법적 지시는 따르겠다"면서도 "잠재적 탈옥 사례가 수억 명에게 배포된 상용 모델을 회수해야 할 이유가 된다는 판단에는 동의하지 않는다"고 했다.

그러면서 "이번 서비스 중단으로 고객에게 불편을 끼쳐 사과한다"며 "이번 사안은 오해에서 비롯된 것으로 보고 있으며, 가능한 한 빨리 접근을 복구하기 위해 노력하고 있다"고 밝혔다.

김희선 한경닷컴 기자 gimme_sun@hankyung.com

Read Entire Article