EuroLLM: 유럽에서 개발된, EU 24개 공식 언어를 지원하는 LLM

1 week ago 8

EuroLLM은 유럽 내 연구기관이 공동 개발한 24개 공식 EU 언어 지원 대형언어모델(LLM) 로, 유럽의 AI 주권과 기술 자립을 목표로 함
9B 파라미터 모델로, 35개 언어에서 4조 개 이상의 토큰으로 학습되어 질문응답, 요약, 번역 등 언어 과제에 강점을 보임
EuroLLM 9B Base는 파인튜닝용으로 공개되었으며, EuroLLM 9B Instruct는 대화형 지시 수행 기능을 갖춘 버전으로 Hugging Face에서 사용 가능
프로젝트는 Unbabel, University of Edinburgh, Técnico Lisboa, Naver Labs Europe 등 유럽 주요 기관이 참여하고 MareNostrum 5 슈퍼컴퓨터에서 학습 수행
멀티모달 확장(이미지·음성) 과 완전한 오픈소스 개방 정책을 예고하며, 유럽 내 AI 혁신 생태계의 핵심 인프라로 자리잡는 것을 목표로 함

EuroLLM 개요

EuroLLM은 유럽에서 개발된 대형 언어모델(Local LLM) 로, 모든 EU 공식 언어 24개를 지원함
- 언어 장벽 없이 유럽 시민·기업·연구자들이 사용할 수 있는 공공 인프라형 AI 모델로 설계됨
유럽연합의 Horizon Europe, European Research Council, EuroHPC의 지원을 받아 개발됨
- MareNostrum 5 슈퍼컴퓨터에서 학습을 수행함

EuroLLM 9B: 90억 파라미터 규모, 35개 언어 4조 토큰 데이터로 학습
- Base 모델은 사용자 파인튜닝용으로, Instruct 모델은 대화형 지시 수행 기능을 갖춤
주요 기능:
- 질문응답, 요약, 번역 등 다국어 자연어 처리 성능에 최적화
- 멀티모달 확장 예정 — 향후 이미지와 음성 이해 기능 추가 예정
- 오픈소스 배포를 통해 연구자, 기관, 일반 시민이 자유롭게 활용 가능

참여 기관:
- Unbabel, Instituto Superior Técnico, University of Edinburgh, Université Paris-Saclay, Aveni.ai, Sorbonne University, Naver Labs Europe, University of Amsterdam
주요 연구 인물:
- André Martins (Unbabel, Lisbon 공대 교수) — 머신러닝 및 자연어처리 전문가
- Alexandra Birch (Aveni.ai, Edinburgh 교수) — 다국어 번역 및 윤리적 AI 연구 선도
- Pierre Colombo (Université Paris-Saclay) — AI 안전성과 법률 AI 응용 연구

EuroLLM의 목표는 유럽의 AI 주권 확보와 다국어 기술 발전 촉진에 있음
- 유럽 내에서 독자적으로 개발된 LLM을 통해 혁신의 선순환(flywheel for innovation) 을 창출
- 연구자와 기업이 유럽산 AI 모델을 기반으로 새로운 서비스와 연구를 확장할 수 있도록 지원
유럽이 언어 다양성에 기반한 기술 리더십을 강화하며,
글로벌 AI 생태계에서 자립적 혁신 모델을 구축하는 것을 지향함