Clawdbot - 오픈소스 개인 AI 어시스턴트

1 week ago 9

  • Moltbot은 사용자가 자신의 기기에서 직접 실행할 수 있는 개인용 AI 어시스턴트로, WhatsApp, Telegram, Slack, Discord 등 다양한 메시징 플랫폼과 연동됨
  • macOS, iOS, Android에서 음성 입출력을 지원하며, 실시간 Canvas 시각 작업 공간을 제공
  • Anthropic ClaudeOpenAI ChatGPT 모델을 포함한 여러 AI 모델을 지원하며, Node.js 22 이상 환경에서 동작
  • 보안 기본값으로 미승인 DM을 차단하고, 승인된 사용자만 대화할 수 있도록 페어링 정책을 적용
  • 로컬 우선 구조와 다중 채널 통합을 통해 개인 데이터 보호와 빠른 응답성을 동시에 제공하는 점이 특징

Moltbot 개요

  • Moltbot은 사용자의 기기에서 직접 실행되는 로컬 기반 AI 어시스턴트로, WhatsApp, Telegram, Slack, Discord, Google Chat, Signal, iMessage, Microsoft Teams, WebChat 등 주요 메시징 플랫폼과 통합 지원
    • 확장 채널로 BlueBubbles, Matrix, Zalo, Zalo Personal도 포함
  • macOS, iOS, Android에서 음성 대화시각적 Canvas 제어 기능 제공
  • Gateway는 제어 평면 역할만 수행하며, 실제 제품은 어시스턴트 자체임
  • 단일 사용자, 빠른 응답, 항상 실행 상태를 원하는 개인에게 적합한 구조

설치 및 실행

  • Node.js 22 이상 환경에서 실행 가능하며, npm, pnpm, bun을 통해 설치
    • 명령어: npm install -g moltbot@latest
  • moltbot onboard 명령으로 온보딩 마법사를 실행해 게이트웨이, 워크스페이스, 채널, 스킬 설정을 단계별로 진행
  • macOS, Linux, Windows(WSL2 권장)에서 CLI 기반 설정 지원
  • Gateway 데몬은 launchd 또는 systemd 사용자 서비스로 등록되어 지속 실행

모델 및 인증

  • Anthropic Claude Pro/MaxOpenAI ChatGPT/Codex 계정을 OAuth로 연동 가능
  • 모든 모델을 지원하지만, 긴 문맥 처리와 프롬프트 주입 방어를 위해 Anthropic Pro/Max (100/200) + Opus 4.5 조합을 권장
  • 모델 인증은 OAuth 또는 API 키 방식으로 구성되며, 자동 페일오버 기능 제공

주요 기능 및 하이라이트

  • Local-first Gateway: 세션, 채널, 도구, 이벤트를 관리하는 단일 제어 평면
  • Multi-channel inbox: 다양한 메시징 플랫폼을 하나의 수신함으로 통합
  • Multi-agent routing: 각 채널과 계정을 개별 에이전트 세션으로 분리
  • Voice Wake / Talk Mode: macOS, iOS, Android에서 항상 켜진 음성 대화 지원
  • Live Canvas: AI가 제어하는 시각적 작업 공간 제공
  • First-class tools: 브라우저 제어, 노드, 크론, 세션, Discord/Slack 액션 등 포함
  • Companion apps: macOS 메뉴바 앱 및 iOS/Android 노드 지원

보안 및 접근 제어

  • Moltbot은 실제 메시징 플랫폼과 연결되므로 수신 DM은 신뢰되지 않은 입력으로 처리
  • 기본 DM 정책(dmPolicy="pairing")은 미승인 발신자에게 페어링 코드를 전송하고, 승인 후에만 메시지를 처리
    • 승인 명령: moltbot pairing approve <channel> <code>
  • 공개 DM 허용 시 dmPolicy="open" 설정과 채널 허용 목록(allowFrom) 지정 필요
  • moltbot doctor 명령으로 위험하거나 잘못된 DM 정책을 점검 가능

아키텍처 및 구성 요소

  • Gateway는 WebSocket 기반 제어 평면으로, 클라이언트·도구·이벤트를 통합 관리
  • 주요 구성 요소:
    • Pi agent (RPC) , CLI, WebChat UI, macOS 앱, iOS/Android 노드
  • Tailscale Serve/Funnel 또는 SSH 터널을 통해 원격 접근 가능
  • macOS 앱은 node mode로 실행되어 로컬 명령(system.run, system.notify, canvas.*, camera.*)을 Gateway를 통해 수행

개발 및 배포

  • 안정(stable), 베타(beta), 개발(dev) 채널로 배포 관리
    • moltbot update --channel stable|beta|dev 명령으로 전환 가능
  • 소스 빌드 시 pnpm 사용 권장, pnpm ui:build로 UI 종속성 자동 설치
  • pnpm gateway:watch 명령으로 TypeScript 변경 시 자동 재로드

도구 및 자동화

  • 브라우저 제어: 전용 Chrome/Chromium 인스턴스 관리, 스냅샷 및 액션 수행
  • 노드 기능: 카메라 캡처, 화면 녹화, 위치 정보, 알림 등 지원
  • 크론 및 웹훅: 자동 작업 및 외부 트리거 연동
  • 스킬 플랫폼: 번들형, 관리형, 워크스페이스형 스킬 설치 및 UI 관리

보안 모델

  • 기본적으로 메인 세션에서는 호스트에서 도구 실행
  • 그룹/채널 세션은 Docker 기반 샌드박스 모드로 격리 가능
    • 허용 명령: bash, process, read, write, edit, sessions_*
    • 차단 명령: browser, canvas, nodes, cron, discord, gateway
  • 보안 가이드는 Security Guide에서 제공

채널별 설정 예시

  • WhatsApp: pnpm moltbot channels login으로 기기 연결, 허용 목록 지정
  • Telegram: TELEGRAM_BOT_TOKEN 설정, 그룹 허용 목록 구성
  • Slack: SLACK_BOT_TOKEN 및 SLACK_APP_TOKEN 필요
  • Discord: DISCORD_BOT_TOKEN 설정, DM 정책 및 길드 설정 지원
  • Signal, iMessage, Microsoft Teams, WebChat 등도 개별 설정 제공

커뮤니티 및 기여

  • 오픈소스 프로젝트로, AI/vibe-coded PR 환영
  • 주요 기여자와 커뮤니티는 GitHub에서 활동 중이며, ClawdHub를 통해 스킬 공유 가능
  • 프로젝트는 Peter Steinberger와 커뮤니티가 공동 개발했으며, 마스코트는 AI 바닷가재 Molty 🦞

Read Entire Article