Caveman: 적은 토큰으로 충분한 답변을 생성하는 Claude/Codex 플러그인

2 hours ago 1
  • LLM의 응답을 ‘원시인 말투’로 변환해 불필요한 단어를 제거, 평균 65~75%의 토큰 절감 달성
  • Lite·Full·Ultra 세 단계로 압축 강도를 조절하며, 기술적 정확성을 유지한 채 짧고 효율적인 답변 생성
  • 실제 벤치마크에서 React·PostgreSQL·Git 관련 설명 모두 토큰 사용량이 절반 이하로 감소
  • 응답 속도 약 3배 향상, 가독성 개선, 비용 절감 효과를 동시에 제공
  • Claude Code와 Codex에서 간단한 명령으로 설치 가능하며, 세션 전반에 걸쳐 지속 사용 가능

Caveman 개요

  • Claude CodeCodex용 플러그인으로, LLM의 응답을 ‘원시인 말투(caveman-speak)’로 변환해 토큰 사용량을 약 75% 절감
  • 기술적 정확성을 유지하면서 불필요한 단어를 제거해 짧고 효율적인 답변 생성
  • 설치는 한 줄 명령으로 가능하며, 모든 세션에서 지속 사용 가능

Before / After 예시

  • 동일한 기술적 설명을 짧은 문장으로 압축해 표현
    • React 컴포넌트 리렌더링 원인 설명: 69토큰 → 19토큰
    • 인증 미들웨어 버그 설명: 75% 이상 토큰 절감
  • Lite / Full / Ultra 세 단계로 압축 강도 조절 가능
    • Lite: 문법 유지, 군더더기 제거
    • Full: 기본 모드, 관사 및 불필요한 문장 제거
    • Ultra: 최대 압축, 전보체 형태

벤치마크

  • Claude API를 통한 실제 토큰 사용량 비교 결과 평균 65% 절감
    • React 버그 설명: 1180 → 159 (87% 절감)
    • PostgreSQL 연결 풀 설정: 2347 → 380 (84% 절감)
    • Git rebase vs merge 설명: 702 → 292 (58% 절감)
    • 전체 범위: 22%~87% 절감
  • 출력 토큰만 감소, 사고·추론 토큰은 그대로 유지
  • 주요 이점은 가독성 향상과 응답 속도 증가, 비용 절감은 부가 효과

과학적 근거

  • 2026년 3월 발표된 논문 “Brevity Constraints Reverse Performance Hierarchies in Language Models” 에 따르면 간결한 응답 제약이 정확도를 26%p 향상시키고 모델 간 성능 순위를 뒤집는 결과 확인
  • 장황한 응답보다 짧은 응답이 더 정확한 경우 존재

설치 방법

  • npx 명령어 또는 Claude Code 플러그인 마켓플레이스에서 설치 가능 npx skills add JuliusBrussee/caveman claude plugin marketplace add JuliusBrussee/caveman claude plugin install caveman@caveman
  • Codex에서는 /plugins 명령으로 검색 후 설치
  • 한 번 설치하면 모든 세션에서 사용 가능

사용법

  • 트리거 명령: /caveman, $caveman, “talk like caveman”, “caveman mode”, “less tokens please”
  • 종료 명령: “stop caveman”, “normal mode”
  • 강도 조절
    Level Trigger 특징
    Lite /caveman lite 문법 유지, 불필요한 단어 제거
    Full /caveman full 기본 모드, 관사·군더더기 제거
    Ultra /caveman ultra 최대 압축, 축약어 중심 표현
  • 설정은 세션 종료 전까지 유지

Caveman의 처리 방식

항목 처리 방식
영어 설명 불필요한 단어 제거
코드 블록 정상 작성
기술 용어 그대로 유지
오류 메시지 원문 인용
Git 커밋/PR 정상 작성
관사(a, an, the) 제거
인사말 제거
완곡 표현 제거

Caveman의 효과

┌─────────────────────────────────────┐ │ TOKENS SAVED ████████ 75% │ │ TECHNICAL ACCURACY ████████ 100%│ │ SPEED INCREASE ████████ ~3x │ │ VIBES ████████ OOG │ └─────────────────────────────────────┘
  • 응답 속도 향상: 생성 토큰 감소로 처리 속도 약 3배 증가
  • 가독성 향상: 핵심만 남겨 읽기 쉬움
  • 정확도 유지: 기술 정보 손실 없음
  • 비용 절감: 출력 토큰 약 71% 감소
  • 재미 요소: 코드 리뷰 등에서 유머 효과

작동 원리

  • 일반 LLM이 사용하는 불필요한 문장 패턴 제거
    • “I’d be happy to help you with that” → 8토큰 낭비
    • “The reason this is happening is because” → 7토큰 낭비
    • “Sure, let me take a look at that for you” → 10토큰 낭비
  • Caveman은 핵심만 전달 후 종료, 효율적 표현 유지

관련 프로젝트

  • Blueprint — Claude Code용 명세 기반 개발 도구, 자연어 → 블루프린트 → 병렬 빌드 → 완성 소프트웨어
  • Revu — macOS용 로컬 학습 앱, FSRS 기반 반복학습·시험·학습가이드 지원

라이선스

  • MIT 라이선스, 자유 사용 가능
Read Entire Article