중국 인공지능(AI) 모델들이 뛰어난 이유에 대해 가장 간단한 설명은 '스파이 행위'입니다. 최첨단 AI 모델을 훈련하는 방식에는 비밀이 많다고 생각합니다. 많은 '암묵적 지식'이 필요하죠. 하이퍼파라미터(AI 모델을 학습시키기 전 개발자가 직접 설정해야 하는 변수)를 어디에 설정할지, 이 모델들을 어떻게 작동시킬지, 그리고 AI 모델 훈련이 잘되게 하는 방법에 대한 많은 비결과 작은 직관들이 있다는 뜻입니다. AI 모델을 훈련하는 방법에 대한 많은 비밀이 최첨단 연구소를 떠나 중국 연구소로 흘러간다.
(The simplest explanation for me about why the Chinese models are so good is espionage. I think that there's a lot of secrets in how these frontier models are trained. there's just a lot of tacit knowledge. There's a lot of tricks and small intuitions about where to set the hyperparameters and ways to make these models work and to get the model training to work. a lot of the secrets about how to train these models, you know, the secrets leave the frontier labs and make their way back to these Chinese labs.)
-지난달 유튜브 채널 'Y Combinator'에서 알렉산더 왕
알렉산더 왕은 누구
메타의 최고 AI 책임자(Chief A.I. Officer). 1997년 미국 뉴멕시코에서 태어난 중국계 이민자 가정 출신의 기업가이자 소프트웨어 엔지니어. 2016년 미국 매사추세츠공대(MIT) 재학 시절 AI 학습용 데이터를 라벨링 하는 서비스를 제공하는 스케일 AI를 공동 창업했다.
데이터 라벨링은 AI 쉽게 할 수 학습할 수 있도록 각종 데이터를 가공하는 작업이다. 자율주행차, 생성형 AI 등 다양한 AI 기술 개발에 필수적인 '연료'를 공급하는 것과 같다. 오픈AI, 마이크로소프트(MS), 제너럴 모터스(GM)뿐만 아니라 미국 국방부 등을 주요 고객으로 확보해 AI 산업의 핵심 인프라 기업으로 성장했다.
지난 6월 메타에 스케일 AI의 지분 49%를 매각했다. 알렉산더 왕은 메타의 최고 AI 책임자로 자리를 옮겼다. 스케일 AI 최고경영자(CEO)직을 내려놓았다. 알렉산더 왕은 스케일 AI 이사회 이사로는 남아 있다.
알렉산더 왕이 하고 싶은 얘기는
중국의 최신 대규모언어모델(LLM) 성능은 미국과 서방 연구소에서 새어 나간 ‘비공개 노하우’ 덕분이라는 주장이다. 이 주장은 미·중 기술 패권 경쟁이라는 맥락에서 이해해야 한다. 그는 중국의 AI 기술력이 자생적으로 성장한 것이 아니라 생각한다. 미국의 선도 기업이 막대한 자원과 시간을 투자해 얻은 '영업 비밀'과 '핵심 노하우'를 부당하게 탈취한 결과라고 본다.
이는 단순히 '중국이 우리 기술을 베꼈다'는 수준을 넘어 AI 개발의 가장 핵심적이고 설명하기 어려운 '예술의 경지'에 가까운 노하우가 유출됐다는 주장이다. 관련 사태의 심각성을 강조한다. 그의 발언은 AI 기술 경쟁이 단순한 혁신 경쟁을 뛰어넘어 국가 간의 치열한 정보전 및 안보 문제와 직결돼 있다는 것이다.
알렉산더 왕의 의견을 단정적으로 '옳다' 또는 '그르다'라고 판단하기 어렵다. 그의 주장은 설득력과 현실적인 배경이 있다. 하지만 산업 스파이 행위를 중국 AI 발전의 모든 것을 설명하는 유일한 요인으로 보는 것은 지나친 단순화라는 지적도 있다.
알렉산더 왕은 단순한 AI 산업 전문가가 아니다. 그가 창업한 스케일 AI는 오픈AI, 구글, 메타 등 거의 모든 '최전선 AI 연구소(Frontier Labs)'에 AI 모델 훈련을 위한 데이터를 제공하는 핵심 파트너다. 그는 AI 개발의 가장 내밀한 과정을 누구보다 가까이에서 지켜보는 위치에 있다. 업계의 생리를 깊숙이 이해할 수밖에 없다.
중국의 기술 탈취 및 산업 스파이 행위는 미국 정부가 수년간 공식적으로 경고한 문제이기도 하다. 미국 법무부는 2024~2025년 구글 엔지니어 출신인 링웨이 딩을 AI 반도체인 'TPU v6' 설계와 AI 훈련 코드 1000여 건을 빼돌려 중국 AI 스타트업 설립에 쓰려한 혐의로 기소했다.
AI 모델 개발에서 '암묵지(Tacit Knowledge)'는 매우 중요하다. 공개된 논문이나 코드만으로는 최고 성능의 AI 모델을 만들기 어렵다는 분석이다. 수많은 실패를 통해 얻은 경험, 문제 해결 노하우, 최적의 하이퍼파라미터를 찾아내는 직관 등은 AI 기업의 가장 중요한 자산으로 알려졌다. 구체적으로 △데이터 필터링·샘플링 레시피 △RLHF(인간 피드백을 통한 강화 학습)/RLAIF(사람 대신 AI가 피드백을 담당하는 강화학습 기법) 파이프라인 △하이퍼파라미터 스케줄 등은 공개되지 않은 '비법'에 AI 개발을 크게 의존한다.
인재 유출도 스파이 행위에 해당할 수 있다. 최고의 AI 인재는 국경을 넘어 이동한다. 정상적인 이직 과정이라 이라도 선두 기업에서 핵심적인 프로젝트를 수행했던 연구원이 경쟁국의 기업으로 옮길 경, 본의 아니게 '암묵지'가 유출될 수 있다.
기술 탈취만이 성장 비결일까
하지만 왕이 중국의 자체적인 역량을 과소평가했다는 지적도 나온다. 왕도 언급했지만 중국은 14억 인구를 바탕으로 한 방대한 양의 데이터는 AI 모델 훈련에서 절대적인 강점이다. 중국 정부는 AI를 국가 전략의 최우선 순위에 두고 대규모 자금과 정책적 지원도 쏟아붓고 있다.
거대한 내수 시장과 인재 풀도 무시하기 어렵다. 치열한 경쟁이 벌어지는 중국의 내수 시장은 AI 기술의 테스트베드가 된다. 2024년 기준 중국의 핵심 AI 산업 규모는 약 6000억위안(약 115조 9920억원)에 달한다. 매년 배출되는 엄청난 수의 STEM(과학·기술·공학·수학) 분야 인재들은 연구 개발의 기반이다. 올해 박사급 STEM 졸업생만 약 7만7000명에 달할 전망이다. 전 세계 최상위 AI 연구자 중 약 26%가 중국 출신으로 알려졌다.
오픈소스 생태계의 AI 발전 기여도 있다. 구글이 공개한 '트랜스포머(Transformer)' 아키텍처 등 AI의 핵심적인 연구 결과들이 오픈소스로 공개되면서 후발 주자가 빠르게 기술을 습득할 수 있는 토양이 마련됐다. 중국 기업 역시 이런 공개 기술을 바탕으로 빠르게 성장했다.
오히려 중국 AI 기업의 혁신을 글로벌 AI 기업이 참고하는 사례가 나오기도 했다. 중국 AI 스타트업 딥시크는 미국 AI 기업이 공개한 AI 기술을 흡수하고 변형해 AI 모델 '딥시크 V3'를 지난해 말에 내놨다. 'Mixture-of-Experts(MoE) 방식의 고효율 구조', 'RL 기반 자기 지도 학습' 등의 혁신적인 'AI 개발 레시피'를 공개했다.
[AI 엑스파일은 글로벌 AI 산업, 학계 등의 최전선에서 AI를 고민하는 이들의 얘기를 전달합니다. 색다른 AI 이슈를 편하게 보시려면 기자 페이지를 구독해 주세요]
김주완 기자 kjwan@hankyung.com