화웨이, Qwen과 DeepSeek 모델 클론 후 자사 모델이라고 주장

7 hours ago 2

  • 화웨이QwenDeepSeek의 대형 AI 모델을 복제한 후 ‘판구(Pangu)’라는 자체 제품으로 내세웠다는 내부 폭로가 제기됨
  • 판구 팀 내부 직원의 증언에 따르면, 일부 실질적 모델은 직접 개발이 아닌 외부 오픈소스 모델에 기반하여 명칭만 변경된 형태임
  • 실제로 135B V2Pro MoE 72B 등 주요 모델이 Qwen 및 DeepSeek의 구조와 상당 수준 일치함이 기술적으로 드러남
  • 내부에서는 이런 관행이 연구진 사기 저하와 이탈로 이어졌으며, 행정적 비효율과 불투명한 인사 정책도 문제를 심화시켰음
  • 진정한 자주 개발 모델(Pangu V3 등)도 있으나, 복제 관행과 인정받지 못하는 연구문화가 조직 전체 신뢰에 큰 상처로 남음
  • 내부 고발자는 자신의 실명을 걸고 진실을 밝히고자 결심했으며, 조직의 반성과 변화를 촉구함

판구의 비극: 화웨이 Noah Ark Lab 판구 대형 모델의 고통스러운 내막

내부 고발자의 소개 및 현장 분위기

  • 필자는 화웨이 Noah 판구 대형모델 팀 소속으로, 주요 조직-프로젝트 구조 및 리더십 구성을 내부 정보와 맞춰 신분을 인증함
  • 판구 프로젝트는 실제로 연구조직보다 납품조직에 가까웠으며, 반복된 마감과 오버워크, 끊임없는 평가 및 보고의 압박에 시달림
  • 업무 강도와 관료주의가 극심했고, 가족과 장기간 떨어져 숙소 생활, 주말 근무도 빈번한 상황
  • 실질적으로 연구의 자율성과 창의성보다는, 각 상품 라인(Cloud, ICT 등) 납기와 실적 위주의 기업문화가 지배적이었음

잠 못 이루는 밤, 짓밟힌 창작의식

  • Qwen 모델 표절 논란 이후, 일부 연구진은 수치심과 분노, 무기력감을 동시에 경험함
  • 폭로자 본인은 거대한 기업과 내부 네트워크의 보복이 두려우나, 더 이상의 사실 은폐와 대외 거짓 홍보를 참을 수 없어 양심 고백 결심

기술적 난관 그리고 표절의 시작

  • 초기 판구 모델은 화웨이 Ascend NPU 기반에서 자체 훈련을 시도했으나, 토크나이저 효율성과 모델 성능 부진 등 심각한 시행착오를 겪음
  • 경쟁사(Alibaba, Zhipu)의 GPU 기반 모델에 뒤처졌고, 자체 230B dense 모델 훈련은 실패로 끝남
  • 이에, 소형 모델 랩은 “자체 개발”로 포장했으나, 실제로는 Qwen-1.5 (110B) 모델을 복제 및 소폭 수정한 135B V2를 만들어 공급, 내부에서도 코드·구조 유사성이 드러남
  • 주요 리더십 및 경영진은 이러한 실상을 알고도, 외부 성과와 실적 압박을 이유로 묵인함

진정한 기술 성취: Pangu V3

  • 절치부심 끝에, 팀은 처음부터 완전히 자체 개발한 Pangu V3 (135B Ultra) 모델을 Ascend에서 독립적으로 훈련
  • 여러 기술적 난관(토크나이저 통일, 손실곡선 안정화 등)을 극복하며, 경쟁사와 유사한 성능을 달성
  • 이 성취는 표절이 아닌 독자적 대형모델 개발의 증거로, 연구진 자부심의 원천이었음

분업 이면의 인정받지 못한 고생

  • 소형모델 랩은 지속적으로 데이터·코드·결과물을 가져가서 손쉽게 모델을 변형/배포했으며, 성과와 포상 등은 주로 해당 조직에 돌아감
  • 이로 인해, 헌신적 연구자들은 조직을 이탈하거나 기술인생의 오점으로 남는 현실을 자조적으로 토로함

224B MoE/718B 클론 등 2차 표절 사례

  • 신규 718B MoE 모델 개발 과정에서도, DeepSeekv3를 거의 그대로 복제한 후 Pangu Pro MoE 72B로 명명하여 배포
  • 내부에서는 이런 관행을 인지했으나, 서로의 생존과 진실 폭로의 두려움으로 쉬쉬하는 분위기

부조리한 행정 관리

  • 진정한 연구진에게는 엄격한 프로세스·모델 계보·감사체계가 적용되어 개발 속도가 지연
  • 하지만 복제 모델의 경우 “위에서 하면 다 통과”하는 이중 잣대가 뿌리 깊게 남아 있음

폭로의 이유와 사임 결심

  • HonestAGI 사건 이후, 회사 차원의 위기 관리와 내부 은폐 시도가 시작됨
  • 폭로자는 “가짜 보고서”와 내부 공모에 더 이상 동참할 수 없다며, 팀원 명단·보고서에서 본인 이름 삭제 및 자진 퇴사 의향 밝힘

마지막 호소 및 동료에 대한 애정

  • 동료들은 이미 ByteDance, DeepSeek, Tencent, Kuaishou 등 타사로 이직하며 화웨이 인재 유출이 심각함을 보여줌
  • 혁신, 적합한 환경, 적은 정치적 장애가 있었다면 세계적 수준의 대형모델 및 칩 개발도 가능하다고 강조
  • 본 내용의 진실성과 추가 폭로에 따른 본인 및 가족 신변 위협 가능성까지 감수하겠다는 의지 표명

추가 정황 설명

  • 135B V2 클론 사례에서는 소형 모델 랩이 포상·인센티브 등 이익만 챙기고, downstream 지원·유지보수 부담은 원 개발팀(4th brigade)에 전가
  • Pangu 기술 보고서 저자 표기에도, 실제로 모델 개발에 핵심적 기여를 한 인원이 제외되고 소형 모델 랩 소속 비기여자가 포함되는 등, 불공정한 학술 관행이 만연함

Read Entire Article