-
EuroLLM은 유럽 내 연구기관이 공동 개발한 24개 공식 EU 언어 지원 대형언어모델(LLM) 로, 유럽의 AI 주권과 기술 자립을 목표로 함
-
9B 파라미터 모델로, 35개 언어에서 4조 개 이상의 토큰으로 학습되어 질문응답, 요약, 번역 등 언어 과제에 강점을 보임
-
EuroLLM 9B Base는 파인튜닝용으로 공개되었으며, EuroLLM 9B Instruct는 대화형 지시 수행 기능을 갖춘 버전으로 Hugging Face에서 사용 가능
- 프로젝트는 Unbabel, University of Edinburgh, Técnico Lisboa, Naver Labs Europe 등 유럽 주요 기관이 참여하고 MareNostrum 5 슈퍼컴퓨터에서 학습 수행
-
멀티모달 확장(이미지·음성) 과 완전한 오픈소스 개방 정책을 예고하며, 유럽 내 AI 혁신 생태계의 핵심 인프라로 자리잡는 것을 목표로 함
EuroLLM 개요
- EuroLLM은 유럽에서 개발된 대형 언어모델(Local LLM) 로, 모든 EU 공식 언어 24개를 지원함
- 언어 장벽 없이 유럽 시민·기업·연구자들이 사용할 수 있는 공공 인프라형 AI 모델로 설계됨
- 유럽연합의 Horizon Europe, European Research Council, EuroHPC의 지원을 받아 개발됨
-
MareNostrum 5 슈퍼컴퓨터에서 학습을 수행함
기술 특징
-
EuroLLM 9B: 90억 파라미터 규모, 35개 언어 4조 토큰 데이터로 학습
-
Base 모델은 사용자 파인튜닝용으로, Instruct 모델은 대화형 지시 수행 기능을 갖춤
- 주요 기능:
-
질문응답, 요약, 번역 등 다국어 자연어 처리 성능에 최적화
-
멀티모달 확장 예정 — 향후 이미지와 음성 이해 기능 추가 예정
-
오픈소스 배포를 통해 연구자, 기관, 일반 시민이 자유롭게 활용 가능
참여 기관 및 협력 네트워크
- 참여 기관:
-
Unbabel, Instituto Superior Técnico, University of Edinburgh, Université Paris-Saclay, Aveni.ai, Sorbonne University, Naver Labs Europe, University of Amsterdam
- 주요 연구 인물:
-
André Martins (Unbabel, Lisbon 공대 교수) — 머신러닝 및 자연어처리 전문가
-
Alexandra Birch (Aveni.ai, Edinburgh 교수) — 다국어 번역 및 윤리적 AI 연구 선도
-
Pierre Colombo (Université Paris-Saclay) — AI 안전성과 법률 AI 응용 연구
미션과 비전
- EuroLLM의 목표는 유럽의 AI 주권 확보와 다국어 기술 발전 촉진에 있음
- 유럽 내에서 독자적으로 개발된 LLM을 통해 혁신의 선순환(flywheel for innovation) 을 창출
- 연구자와 기업이 유럽산 AI 모델을 기반으로 새로운 서비스와 연구를 확장할 수 있도록 지원
- 유럽이 언어 다양성에 기반한 기술 리더십을 강화하며,
글로벌 AI 생태계에서 자립적 혁신 모델을 구축하는 것을 지향함