개발자 David Noel Ng가 Qwen2-72B 모델의 중간 레이어 7개 구간만 반복 통과시키는 아주 간단한 방법으로, 가중치·파인튜닝 전혀 없이 2024년 HuggingFace Open LLM 리더보드 1위를 찍음. 주요 포인트 Qwen2-72B (총 80개 레이어)에서 특정 중간 구간(45~51번 레이어, 7개)을 한 번 더 통과시키는 식으로 모델을 수정 벤치마크 결과 왜 효과가 있었나? 실험 방식 추가 인사이트 결론
→ 파라미터는 72B → 약 78B로 늘지만 새로운 가중치는 0개 추가
→ 중간의 추론 회로를 한 번 더 돌리면 그 기능이 강화됨
RTX 4090 2장으로 3,241가지 레이어 구간 조합을 전수 조사 → 열지도(heatmap) 분석
→ 특정 구간(45~52)만 반복하면 성능이 급상승하는 패턴 발견
LLM은 단순히 레이어를 쌓은 게 아니라, 뇌처럼 기능적으로 분화된 회로를 가지고 있다.
이 회로를 찾아내서 반복 통과시키는 것만으로도 가중치 건드리지 않고 성능을 크게 끌어올릴 수 있다는 발견.

1 month ago
22


![[사설] ‘AI 괴물 해커’ 등장, 북한이 가장 관심 있을 것](https://www.chosun.com/resizer/v2/4VXZD5TPHZJIXRV5YQ4T2ETGLQ.jpg?auth=67f6c152837c4859d2d377d7790c043d6ead2ef97e5bc8589c6f83789aa94a72&smart=true&width=720&height=532)
![[천자칼럼] 인간 이긴 로봇 마라토너](https://static.hankyung.com/img/logo/logo-news-sns.png?v=20201130)

![[국방AX 토론회] 설명·신뢰·통제 가능한 국방 AI 필요…전군 호환체계 구축해야](https://img.etnews.com/news/article/2026/04/01/news-p.v1.20260401.a52adde9b1c54d48b8c61239cc63b058_P1.jpg)

![[부음] 김성태(서울경제 사회부 기자)씨 외조부상](https://img.etnews.com/2017/img/facebookblank.png)

English (US) ·