크래프톤, AI 모델 브랜드 ‘Raon’ 론칭…기술 역량 입증

2 hours ago 2

AI 모델 4종 오픈소스 공개…음성·시각 멀티모달 역량 발휘

크래프톤 AI 모델 브랜드 ‘라온’

크래프톤 AI 모델 브랜드 ‘라온’

크래프톤(대표 김창한)이 인공지능(AI) 모델 브랜드 ‘라온(Raon)’을 론칭했다. 음성 지원 대규모 언어 모델(LLM)과 실시간 음성 대화 모델, 텍스트-음성 변환(TTS) 모델, 비전 인코더 등도 글로벌 플랫폼 허깅페이스에 오픈소스로 공개하며 AI 기술 역량을 입증했다. 크래프톤은 향후 ‘라온’을 중심으로 글로벌 AI 기술 경쟁력을 더욱 강화해 나간다는 계획이다.

이번에 공개된 AI 모델 브랜드 ‘Raon’은 ‘즐거움’을 뜻하는 순우리말 ‘라온’에서 착안했다. 영문명은 크래프톤(KRAFTON)의 일부 철자를 활용했다.

크래프톤은 “AI 기술을 통해 게임의 본질적인 즐거움을 창출하고자 하는 철학을 반영했다”라며 “이번 모델 공개를 통해 데이터 수집부터 모델 학습, 성능 평가까지 파운데이션 모델 개발 전 과정을 자체적으로 수행할 수 있는 기술 역량을 입증했다”라고 자신했다.

공개된 모델은 ‘Raon-Speech’, ‘Raon-SpeechChat’, ‘Raon-OpenTTS’, ‘Raon-VisionEncoder’ 등이다. 음성과 시각 정보를 아우르는 크래프톤의 멀티모달 AI 역량을 발휘했다.

크래프톤이 공개한 AI 모델 4종

크래프톤이 공개한 AI 모델 4종

‘Raon-Speech’는 텍스트 중심 언어 모델을 확장해 음성 이해와 생성이 가능한 음성 언어 모델이다.

크래프톤에 따르면 90억(9B) 파라미터 규모로 10B 이하급 공개 음성 언어 모델 중 영어와 한국어 모두 글로벌 1위 성능을 기록했다. 음성 텍스트 변환, 텍스트 음성 변환, 음성 기반 질의응답 등 7개 핵심 태스크 및 40개 벤치마크를 종합 평가해 태스크별 평균 순위를 동일 비중으로 반영한 결과라는 설명이다.

‘Raon-SpeechChat’은 사용자와 모델이 대화 중 자유롭게 끼어들 수 있는 실시간 양방향 통신(Full-duplex) 기술을 적용한 음성 언어 모델이다.

크래프톤은 “국내에서 발표된 최초의 실시간 양방향 음성 모델”이라며 “양방향 통신 모델 평가 벤치마크 3종에서 맞장구, 끼어들기 처리, 응답 지연 시간 등 주요 13개 태스크 평균 순위 기준 글로벌 최상위권 성능을 기록했다”라고 강조했다.

‘Raon-OpenTTS’는 공개 음성 데이터만으로 학습된 텍스트-음성 변환 모델이다. 기존에 활용이 어려웠던 일부 데이터는 직접 수집 및 정제하여 공개했다. 전체 학습 데이터도 공개해 누구나 동일한 환경에서 학습을 재현할 수 있도록 했다는 설명이다. 크래프톤이 진행한 두 음성의 자연스러움을 사람이 비교하는 블라인드 평가에서 비공개 데이터 기반 글로벌 연구용 TTS 모델들과 비교해 최상위 수준의 성능을 보였다.

‘Raon-VisionEncoder’는 이미지를 AI가 이해 가능한 정보로 바꿔주는 비전 인코더다. 비전 인코더를 언어 모델과 결합할 경우 시각 정보를 처리할 수 있다.

크래프톤은 공개 데이터만 활용해 사전 학습된 모델을 쓰지 않고 처음부터 자체 학습했다고 설명했다. 일부 시각 인식 태스크에서 구글의 대표 비전 인코더 모델(SigLIP2)을 상회하는 결과를 기록했고 그 외 태스크에서도 SigLIP2 대비 90% 이상의 성능을 보이며 경쟁력을 입증했다고 강조하기도 했다. 해당 기술은 ‘독자 AI 파운데이션 모델’ 프로젝트에서도 활용할 방침이다.

크래프톤은 파운데이션 모델 설계부터 AI 에이전트, 새로운 게임성을 위한 CPC(Co-Playable Character) 기술의 게임 적용까지 전 주기에 걸친 AI 기술 역량 강화에 힘쓰고 있다. 지난해 개인용 AI 비서 ‘KIRA(키라)’를 선보였으며 지난달에는 AI 에이전트 성능을 개선하는 ‘Terminus-KIRA’ 기술을 오픈소스로 공개했다. 또 CPC와 같은 AI 기반 상호작용 콘텐츠를 통해 새로운 게임 경험을 확장하고 있다.

이강욱 크래프톤 CAIO는 “이번 ‘Raon’ 모델 시리즈 공개는 AI 기술 역량을 축적해 나가는 과정의 중요한 이정표”라며 “대규모 학습 데이터와 핵심 모델을 오픈소스로 공유해 연구자와 개발자들이 자유롭게 활용할 수 있도록 하고 멀티모달 기술 발전과 국내 AI 생태계의 성장에 기여하기를 기대한다”고 밝혔다.

Read Entire Article