개발 좋아하는 대학생입니다. AI한테 뭔가 시킬 때마다 타이핑이 병목이라 음성 입력을 찾아봤는데, 처음에 Superwhisper를 썼었습니다. 나름 나쁘지 않았는데, 한국어 전용이 아니다 보니까 단어를 계속 틀리더라구요.
- "GitHub에 PR 올려놨어"라고 하면 → '깃펍 펄 올렸어' 같은 식으로 전사해줍니다
- 레이턴시는 좋았는데, 인식률이 답답했습니다
돈을 내면 나아지긴 하더라구요. 근데 대학생이라 돈이 궁해서,,, 내기 싫었습니다.
→ 그래서 로컬 STT랑 LLM으로 구현해봤는데, 너무 느렸습니다.
→ 그러다 생각해보니까 저는 이미 GPT를 구독하고 있으니, OAuth로 LLM을 빌려 쓸 수 있고, STT는 Groq 같은 걸로 거의 공짜에 가깝게 쓸 수 있겠더라구요.
그 방향으로 개인용 macOS 앱을 Swift로 만들었습니다.
핵심 동작: 핫키 누르고 말하면 STT → LLM 교정 → 원래 커서 위치에 자동 붙여넣기.
타이핑 대비 3~5배 빠르고, 녹음 중에 다른 창을 봤어도 처음 포커스 위치를 기억해서 정확히 그곳에 삽입합니다.
기존 음성 타이핑 앱과의 차이
기존 앱은 STT → 붙여넣기로 끝나는데, Whispree는 STT 뒤에 LLM 교정 레이어가 붙습니다. 시중 앱은 한국어 전용이 없더라구요.
"밸리데이션 해야 되거든" → "validation 해야 되거든" "랙트 컴포넌트" → "React 컴포넌트" "깃헙에 펄 올려놨어" → "GitHub에 PR 올려놨어"만들고 나니까 만족감이 꽤 높아서, 계속 쓰면서 기능을 붙여 나갔습니다.
Structured Mode
계속 AI한테 말로 입력하다 보니까, 제가 생각보다 두서없이 말하더라구요. "그리고", "음" 같은 게 많이 들어가고. 그래서 LLM이 후보정해서 불릿포인트로 구조화해주면 좋겠다 싶어서 만들었습니다.
기획을 쏟아낼 때 핫키 누르고 쭈루룩 말하면 정리된 프롬프트가 들어갑니다.
Visual Context
말만 가지고는 맥락을 모르니까 LLM이 엉뚱하게 교정하는 경우가 있었습니다. 그래서 녹음 중 보고 있는 화면을 자동 캡처하기로 했습니다.
- 처음에는 포커스된 화면만 넣었는데, 실제로는 다른 탭들도 둘러보면서 제가 녹음하더라구요
- 그래서 모든 탭을 다 캡처하는 쪽으로 확장했습니다
- 탭 전환하면 이전 탭 즉시 캡처, 한 화면에서 1.5초 멈추면 그 시점 캡처
- 스크린샷을 직접 프롬프트에 붙여넣는 기능도 추가했습니다
Quick Fix (Ctrl+Shift+D)
틀린 단어를 교정 사전에 바로 등록합니다. 그럼 인식률이 올라갑니다. 이것도 단어 사전 기능 만들고, 귀찮아서 핫키로 만들었습니다.
거의 무료
- STT: Groq API (무료)
- LLM 교정: Codex CLI 인증 토큰을 그대로 가져다 씁니다. OpenAI 계정만 있으면 추가 비용 거의 없음
- 로컬 전용도 가능: 만약 Codex 구독 계정이 없으시면, 로컬 모델들을 사용하실 수 있습니다. 다만 Qwen light한 모델 쓰시거나 STT만 쓰시는게 DX가 좋을 겁니다...
프로바이더 & 모드
- STT: WhisperKit / Groq / MLX Audio 3종
- LLM: 로컬 6종(Qwen, GLM) + OpenAI 5종
- 교정 모드: Standard / Filler Removal / Structured / Custom 4가지
- 앱 내 Can I Run 기능으로 본인 기기 호환성 등급 확인 가능
설치
brew tap Arsture/whispree && brew install --cask whispreemacOS 14+ (Sonoma), Apple Silicon 전용입니다. 처음에 저만 쓸 거였어서 macOS로 만들었고, 아직 다른 플랫폼은 지원하지 않습니다.
이름도 처음엔 FreeWhisper였습니다. 저만 무료로 쓰려고 했거든요. 그러다 오픈소스로 공개하려니까 FreeWhisper는 좀 짜치더라구요. API 키를 빌려다 쓴다는 데서 "NotMyWhisper"도 생각해봤습니다. 약간 아일릿의 '빌려온 고양이' 같은 느낌이라 좋더라구요. 근데 계속 쓰다 보니 "이건 남의 whisper가 아니라 내 whisper인데?" 같은 느낌이 들어서, 결국 Whispree가 되었습니다.
MIT 라이선스 오픈소스입니다. 피드백 환영합니다.

3 hours ago
1








English (US) ·