업스테이지가 자사의 차세대 거대언어모델(LLM) ‘솔라 프로 2’를 공식 출시했다. 솔라 프로 2는 단순한 텍스트 생성 능력을 넘어, 논리적 사고를 기반으로 복잡한 문제를 해결할 수 있도록 설계된 차세대 추론형 LLM이다. 전작 ‘솔라 프로’와 비교해 매개변수 규모를 220억(22B)에서 310억(31B)으로 확장해 성능을 크게 끌어올렸다.
이번 버전에는 업스테이지 LLM 최초로 하이브리드 모드가 도입됐다. 사용자는 프롬프트 입력 시 빠른 응답에 최적화된 ‘챗 모드’와, 단계적 사고를 통해 구조화된 답변을 생성하는 ‘추론 모드’ 중 상황에 따라 선택할 수 있다. 특히 ‘생각 사슬(Chain of Thought, CoT)’ 기법을 적용한 추론 모드는 수학과 코딩처럼 복잡한 작업에서 성능 개선을 이끌어냈다.
실제로 솔라 프로 2는 ‘종합지식(MMLU-Pro)’, ‘수학(Math500, AIME)’, ‘코딩(SWE-Bench)’ 등 고난도 추론 중심 벤치마크에서 ‘GPT-4o’, ‘딥시크 R1’, ‘미스트랄 스몰 3.2’, ‘큐원 3’ 등에 필적하는 성능을 보였다. 이는 글로벌 프런티어급 모델들과의 성능 격차를 실질적으로 좁힌 것으로, 세계적인 수준의 LLM을 자체 기술로 구현해냈다는 점에서 의미가 크다.
한국어 성능도 두드러진다. ‘인간 선호도(Arena-Hard-Auto)’, ‘해례(Hae-Rae)', ‘언어 이해력(Ko-MMLU)’ 등 주요 한국어 벤치마크에서 글로벌 모델을 뛰어넘는 결과를 기록하며, 업스테이지의 기술 경쟁력을 입증했다. 어휘·문맥 이해, 문화적 맥락 반영 등 고도화된 언어 처리 능력은 물론, 금융·의료·법률 등 전문 분야에서도 높은 정확도와 실효성을 보였다.
솔라 프로 2는 단순한 언어 이해를 넘어 사용자의 의도를 파악하고 외부 도구를 활용해 실행 가능한 결과물을 제공하는 ‘에이전트형 LLM’으로도 진화했다. 예컨대 “최근 3개월간 경쟁사 신제품 출시 동향을 조사하고, 관련 기사 링크를 포함한 PPT 초안을 작성해줘”라는 요청을 받으면, 실시간 웹 검색으로 데이터를 수집하고 이를 분석해 발표 자료까지 생성하는 과정을 모델이 정확히 계획 후 자율적으로 수행한다.
업스테이지 김성훈 대표는 “솔라 프로 2는 단순히 말을 잘하는 AI를 넘어, 문제를 이해하고 논리적으로 사고하며 실질적인 행동까지 수행하는 ‘AI 에이전트’ 시대의 차세대 언어모델”이라며 “업스테이지는 ‘일의 미래’를 앞당길 수 있도록 지속적으로 기술을 발전시켜 나가겠다”고 밝혔다.
고은이 기자 koko@hankyung.com