카카오, AI 안전성 검증 모델 공개⋯"안전한 생태계 구축 기여"

1 month ago 7

자체 개발 언어모델 '카나나' 기반 기술로 만든 모델 3종 오픈소스로 공개
이용자 발화나 AI 답변에서 유해성 탐지, 서비스 악용하려는 공격 탐지 등⋯상업적 이용도 가능

[아이뉴스24 정유림 기자] 카카오는 인공지능(AI) 서비스의 안전성과 신뢰성을 검증할 수 있는 AI 모델 '카나나 세이프가드'를 개발하고 국내 기업 최초로 총 3종의 모델을 오픈소스로 공개한다고 27일 밝혔다.

카카오 측은 최근 다양한 생성형 AI 서비스가 확산하는 가운데, 유해 콘텐츠의 위험성에 대한 사회적 우려가 커지면서 이러한 AI 모델을 개발하게 됐다고 밝혔다. 기술·제도적 장치의 필요성에 따른 판단인 것이다. 주요 빅테크(대형 IT 기업)에서도 생성형 AI를 통해 발생할 수 있는 위험 요소를 감지하는데 특화된 모델을 운영 중인 것으로 알려졌다.

이 모델은 카카오가 자체 개발한 언어모델 '카나나'를 기반 기술로 활용했다. 한국어와 한국 문화를 반영한 자체 구축 데이터셋을 활용해 한국어에 특화된 성능을 보유한 것이 특징이다. 회사에 따르면 AI 모델의 정밀도와 재현율을 평가하는 수치인 F1 스코어를 기준으로 평가한 결과, 한국어 성능에서 글로벌 모델 이상의 성과를 기록했다.

오픈소스로 공개한 모델은 총 3가지로, 각각의 모델은 리스크 유형에 따라 유해성, 위험성에 대한 탐지가 가능하다. △이용자의 발화 또는 AI의 답변에서 증오, 괴롭힘, 성적 콘텐츠 등에 대한 유해성을 탐지하는 '카나나 세이프가드' △개인 정보나 지식재산권 등 법적 측면에서 주의가 필요한 요청을 탐지하는 '카나나 세이프가드-사이렌(Siren)' △AI 서비스를 악용하려는 이용자의 공격을 탐지하는 '카나나 세이프가드-프롬프트(Prompt)' 등이다.

이번에 공개한 모델은 상업적 이용과 수정·재배포 등이 가능하다. 카카오는 향후 지속적인 업데이트를 통해 모델을 고도화할 방침이다. 김경훈 카카오 AI 안전(Safety) 리더는 "책임감 있는 AI 구축에 대한 인식을 널리 확산시키고 사회적 가치를 고려한 기술 개발이 이어질 수 있도록 선제적인 대응을 이어갈 것"이라고 밝혔다.

/정유림 기자(2yclever@inews24.com)

포토뉴스