네이버클라우드가 AI 에이전트 핵심 기술로 주목받는 추론 모델을 연구용이 아닌 상업용으로 이용할 수 있도록 오픈소스로 공개했다.
네이버클라우드는 22일 독자 기술을 활용해 '프롬 스크래치'로 개발한 경량화 추론 모델 '하이퍼클로바X 시드 14B 씽크'를 상업용으로 쓸 수 있는 무료 오픈소스로 공개했다고 밝혔다. 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발했다는 설명이다.
하이퍼클로바X 시드 14B 씽크는 지난달 30일 공개된 추론 모델 하이퍼클로바X 씽크를 안정적·비용효율적으로 서비스에 접목할 수 있또록 경량화한 모델이다. 중요도가 낮은 파라미터를 가지치기하면서도 원본 모델이 가진 지식을 최대한 보존하고 이 과정에서 손실이 생긴 큰 모델의 지식을 작은 모델에 전이하는 방식으로 학습 비용을 낮췄다.
네이버클라우드에 따르면 이 모델은 140억개 파라미터 규모의 모델인데도 5억개 파라미터로 구성된 글로벌 오픈소스 모델보다 더 적은 비용(GPU Hours)으로 학습됐다. 같은 크기 글로벌 오픈소스 모델과 비교하면 1회 학습 비용은 약 100분의 1 수준이다.
한국어·한국문화, 코딩·수학 관련 성능을 측정하는 평가에선 같은 크기 또는 상대적으로 큰 규모(320억개) 모델과 유사하거나 높은 평균 점수를 나타냈다.
지난 4월 오픈소스로 공개된 하이퍼클로바X 경량모델 3종은 이달 기준 누적 다운로드 수 100만건을 넘어섰다. 50여개에 이르는 1차 파생모델을 바탕으로 새로운 파생모델이 생산·공유되고 한국거 온디바이스 AI 서비스가 출시되는 등 하이퍼클로바X 오픈소스 생태계가 확장되고 있다는 설명이다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "독자적 기술로 생성형 AI 모델을 꾸준히 업그레이드하면서 구축한 고성능 플래그십 모델과 수많은 실험·개선을 통해 설계한 효율적인 학습 전략을 바탕으로 동일 규모에서 비용·성능 등이 더 효과적인 추론모델을 구축할 수 있었다"고 했다.
그러면서 "해외의 상용 모델을 개조한 기술로 그들의 생태계에 편입되기보다는 토대부터 자체 기술로 구축한 하이퍼클로바X가 한국 AI 생태계의 본격적 성장을 이끌 수 있기를 기대한다"고 말했다.
김대영 한경닷컴 기자 kdy@hankyung.com