- LLM의 응답을 ‘원시인 말투’로 변환해 불필요한 단어를 제거, 평균 65~75%의 토큰 절감 달성
-
Lite·Full·Ultra 세 단계로 압축 강도를 조절하며, 기술적 정확성을 유지한 채 짧고 효율적인 답변 생성
- 실제 벤치마크에서 React·PostgreSQL·Git 관련 설명 모두 토큰 사용량이 절반 이하로 감소
-
응답 속도 약 3배 향상, 가독성 개선, 비용 절감 효과를 동시에 제공
-
Claude Code와 Codex에서 간단한 명령으로 설치 가능하며, 세션 전반에 걸쳐 지속 사용 가능
Caveman 개요
-
Claude Code 및 Codex용 플러그인으로, LLM의 응답을 ‘원시인 말투(caveman-speak)’로 변환해 토큰 사용량을 약 75% 절감
- 기술적 정확성을 유지하면서 불필요한 단어를 제거해 짧고 효율적인 답변 생성
- 설치는 한 줄 명령으로 가능하며, 모든 세션에서 지속 사용 가능
Before / After 예시
- 동일한 기술적 설명을 짧은 문장으로 압축해 표현
- React 컴포넌트 리렌더링 원인 설명: 69토큰 → 19토큰
- 인증 미들웨어 버그 설명: 75% 이상 토큰 절감
-
Lite / Full / Ultra 세 단계로 압축 강도 조절 가능
- Lite: 문법 유지, 군더더기 제거
- Full: 기본 모드, 관사 및 불필요한 문장 제거
- Ultra: 최대 압축, 전보체 형태
벤치마크
- Claude API를 통한 실제 토큰 사용량 비교 결과 평균 65% 절감
- React 버그 설명: 1180 → 159 (87% 절감)
- PostgreSQL 연결 풀 설정: 2347 → 380 (84% 절감)
- Git rebase vs merge 설명: 702 → 292 (58% 절감)
- 전체 범위: 22%~87% 절감
-
출력 토큰만 감소, 사고·추론 토큰은 그대로 유지
- 주요 이점은 가독성 향상과 응답 속도 증가, 비용 절감은 부가 효과
과학적 근거
- 2026년 3월 발표된 논문 “Brevity Constraints Reverse Performance Hierarchies in Language Models” 에 따르면
간결한 응답 제약이 정확도를 26%p 향상시키고 모델 간 성능 순위를 뒤집는 결과 확인
- 장황한 응답보다 짧은 응답이 더 정확한 경우 존재
설치 방법
-
npx 명령어 또는 Claude Code 플러그인 마켓플레이스에서 설치 가능
npx skills add JuliusBrussee/caveman
claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman
-
Codex에서는 /plugins 명령으로 검색 후 설치
- 한 번 설치하면 모든 세션에서 사용 가능
사용법
- 트리거 명령: /caveman, $caveman, “talk like caveman”, “caveman mode”, “less tokens please”
- 종료 명령: “stop caveman”, “normal mode”
-
강도 조절
Level
Trigger
특징
| Lite |
/caveman lite |
문법 유지, 불필요한 단어 제거 |
| Full |
/caveman full |
기본 모드, 관사·군더더기 제거 |
| Ultra |
/caveman ultra |
최대 압축, 축약어 중심 표현 |
- 설정은 세션 종료 전까지 유지
Caveman의 처리 방식
항목
처리 방식
| 영어 설명 |
불필요한 단어 제거 |
| 코드 블록 |
정상 작성 |
| 기술 용어 |
그대로 유지 |
| 오류 메시지 |
원문 인용 |
| Git 커밋/PR |
정상 작성 |
| 관사(a, an, the) |
제거 |
| 인사말 |
제거 |
| 완곡 표현 |
제거 |
Caveman의 효과
┌─────────────────────────────────────┐
│ TOKENS SAVED ████████ 75% │
│ TECHNICAL ACCURACY ████████ 100%│
│ SPEED INCREASE ████████ ~3x │
│ VIBES ████████ OOG │
└─────────────────────────────────────┘
-
응답 속도 향상: 생성 토큰 감소로 처리 속도 약 3배 증가
-
가독성 향상: 핵심만 남겨 읽기 쉬움
-
정확도 유지: 기술 정보 손실 없음
-
비용 절감: 출력 토큰 약 71% 감소
-
재미 요소: 코드 리뷰 등에서 유머 효과
작동 원리
- 일반 LLM이 사용하는 불필요한 문장 패턴 제거
- “I’d be happy to help you with that” → 8토큰 낭비
- “The reason this is happening is because” → 7토큰 낭비
- “Sure, let me take a look at that for you” → 10토큰 낭비
- Caveman은 핵심만 전달 후 종료, 효율적 표현 유지
관련 프로젝트
-
Blueprint — Claude Code용 명세 기반 개발 도구, 자연어 → 블루프린트 → 병렬 빌드 → 완성 소프트웨어
-
Revu — macOS용 로컬 학습 앱, FSRS 기반 반복학습·시험·학습가이드 지원
라이선스