Caveman: 적은 토큰으로 충분한 답변을 생성하는 Claude/Codex 플러그인

2 hours ago 1

LLM의 응답을 ‘원시인 말투’로 변환해 불필요한 단어를 제거, 평균 65~75%의 토큰 절감 달성
Lite·Full·Ultra 세 단계로 압축 강도를 조절하며, 기술적 정확성을 유지한 채 짧고 효율적인 답변 생성
실제 벤치마크에서 React·PostgreSQL·Git 관련 설명 모두 토큰 사용량이 절반 이하로 감소
응답 속도 약 3배 향상, 가독성 개선, 비용 절감 효과를 동시에 제공
Claude Code와 Codex에서 간단한 명령으로 설치 가능하며, 세션 전반에 걸쳐 지속 사용 가능

Caveman 개요

Claude Code 및 Codex용 플러그인으로, LLM의 응답을 ‘원시인 말투(caveman-speak)’로 변환해 토큰 사용량을 약 75% 절감
기술적 정확성을 유지하면서 불필요한 단어를 제거해 짧고 효율적인 답변 생성
설치는 한 줄 명령으로 가능하며, 모든 세션에서 지속 사용 가능

Before / After 예시

동일한 기술적 설명을 짧은 문장으로 압축해 표현
- React 컴포넌트 리렌더링 원인 설명: 69토큰 → 19토큰
- 인증 미들웨어 버그 설명: 75% 이상 토큰 절감
Lite / Full / Ultra 세 단계로 압축 강도 조절 가능
- Lite: 문법 유지, 군더더기 제거
- Full: 기본 모드, 관사 및 불필요한 문장 제거
- Ultra: 최대 압축, 전보체 형태

벤치마크

Claude API를 통한 실제 토큰 사용량 비교 결과 평균 65% 절감
- React 버그 설명: 1180 → 159 (87% 절감)
- PostgreSQL 연결 풀 설정: 2347 → 380 (84% 절감)
- Git rebase vs merge 설명: 702 → 292 (58% 절감)
- 전체 범위: 22%~87% 절감
출력 토큰만 감소, 사고·추론 토큰은 그대로 유지
주요 이점은 가독성 향상과 응답 속도 증가, 비용 절감은 부가 효과

과학적 근거

2026년 3월 발표된 논문 “Brevity Constraints Reverse Performance Hierarchies in Language Models” 에 따르면 간결한 응답 제약이 정확도를 26%p 향상시키고 모델 간 성능 순위를 뒤집는 결과 확인
장황한 응답보다 짧은 응답이 더 정확한 경우 존재

설치 방법

npx 명령어 또는 Claude Code 플러그인 마켓플레이스에서 설치 가능 npx skills add JuliusBrussee/caveman claude plugin marketplace add JuliusBrussee/caveman claude plugin install caveman@caveman
Codex에서는 /plugins 명령으로 검색 후 설치
한 번 설치하면 모든 세션에서 사용 가능

사용법

트리거 명령: /caveman, $caveman, “talk like caveman”, “caveman mode”, “less tokens please”
종료 명령: “stop caveman”, “normal mode”
강도 조절
Level Trigger 특징

Lite /caveman lite 문법 유지, 불필요한 단어 제거

Full /caveman full 기본 모드, 관사·군더더기 제거

Ultra /caveman ultra 최대 압축, 축약어 중심 표현
설정은 세션 종료 전까지 유지

Caveman의 처리 방식

항목 처리 방식

영어 설명	불필요한 단어 제거
코드 블록	정상 작성
기술 용어	그대로 유지
오류 메시지	원문 인용
Git 커밋/PR	정상 작성
관사(a, an, the)	제거
인사말	제거
완곡 표현	제거

Caveman의 효과

┌─────────────────────────────────────┐ │ TOKENS SAVED ████████ 75% │ │ TECHNICAL ACCURACY ████████ 100%│ │ SPEED INCREASE ████████ ~3x │ │ VIBES ████████ OOG │ └─────────────────────────────────────┘

응답 속도 향상: 생성 토큰 감소로 처리 속도 약 3배 증가
가독성 향상: 핵심만 남겨 읽기 쉬움
정확도 유지: 기술 정보 손실 없음
비용 절감: 출력 토큰 약 71% 감소
재미 요소: 코드 리뷰 등에서 유머 효과

작동 원리

일반 LLM이 사용하는 불필요한 문장 패턴 제거
- “I’d be happy to help you with that” → 8토큰 낭비
- “The reason this is happening is because” → 7토큰 낭비
- “Sure, let me take a look at that for you” → 10토큰 낭비
Caveman은 핵심만 전달 후 종료, 효율적 표현 유지

관련 프로젝트

Blueprint — Claude Code용 명세 기반 개발 도구, 자연어 → 블루프린트 → 병렬 빌드 → 완성 소프트웨어
Revu — macOS용 로컬 학습 앱, FSRS 기반 반복학습·시험·학습가이드 지원

라이선스

MIT 라이선스, 자유 사용 가능

Read Entire Article