개인용 AI 팩토리 구축기 (2025년 7월 스냅샷)

8 hours ago 1

  • 여러 AI 에이전트(claude/o3/sonnet 등) 를 활용해 코드 생성부터 검증까지 자동화하는 개인용 "AI 팩토리" 워크플로를 운영함
  • 문제 발생 시 코드(Output)를 직접 수정하지 않고 플랜, 프롬프트, 에이전트 구성등 입력(Input)을 개선하여 자동화 수준을 높이는 방식이 핵심
  • 이렇게 입력을 반복적으로 개선하면, 에이전트들이 지속적으로 발전하여 반복적인 작업 생산성을 극대화함
  • 각 에이전트 역할 분담: 계획 수립(o3/sonnet4), 실행(sonnet3.7/4), 검증(o3/sonnet4) 등으로 구분하여 병렬 처리와 자동 피드백 루프 구현
  • 코드 오류나 스타일 문제도 계획 템플릿에 반영해 다음 생성부터 개선되도록 설계, 반복적 입력 개선으로 팩토리 자체가 성장함

AI 팩토리 개요 및 핵심 원칙

  • 여러 개의 claude code 창을 서로 다른 git-worktree에 띄워 분리된 작업 환경을 유지함
  • o3와 sonnet 4는 플랜 수립에 활용되고, sonnet 3.7 또는 sonnet 4는 실행을, o3는 결과 평가를 수행함
  • 계획 수립, 실행, 검증을 에이전트별로 병렬 분담하여 효율화함

핵심 원칙 – "결과(Output) 수정 대신 입력(Input) 자체를 개선"**

  • 문제가 생기면 생성된 코드를 직접 패치하지 않고, 플랜, 프롬프트, 에이전트 혼합비를 조정해 자동화된 개선을 추구함
  • Factorio 게임처럼, 자동으로 성장하는 공장식 AI 에이전트 네트워크를 만든다는 컨셉임
  • 이런 구조에서 계획-코딩-검증-개선까지의 루프가 순환되며, AI 에이전트가 스스로 코드를 생산/검증/개선하는 환경을 조성함

일상 워크플로 – 팩토리의 구조

  • 메인 인터페이스는 claude code이며, 로컬에서는 mcp 및 Goose(Azure OpenAI 모델 연결용), o3 등을 활용함

1단계: 계획(Planning)

  • claude code에 고수준 작업(task) 입력 → o3가 추가 질문 후 계획안(<task>-plan.md) 생성
  • 계획안에는 원래 요청사항과 구현 플랜이 포함됨

2단계: 실행(Execution)

  • sonnet 4가 계획을 검토 후 태스크 리스트로 변환
  • claude code가 작업을 실행하며, 과제 복잡도에 따라 sonnet 3.7 또는 4를 사용함
  • claude가 각 작업 단계마다 커밋 기록을 남기므로 문제 발생 시 손쉬운 롤백이 가능함

3단계: 검증 및 피드백(Verification → Feedback)

  • sonnet 4가 생성 코드를 플랜에 맞추어 초기 검증 수행
  • 이어서 o3가 플랜 및 최초 요구사항과 비교해 보다 엄격히 검증함
    • o3는 불필요한 코드(예: lint ignore 플래그)나 구식 구조를 엄격하게 지적
  • 검증에서 드러난 문제는 코드 직접 수정이 아닌 계획 템플릿 개선으로 반영
  • git worktree를 활용해 여러 claude code 인스턴스를 병렬로 운영하며, 동시 다중 작업이 가능함

"입력"이 "출력"보다 중요한 이유

  • 결과물(Output)은 버릴 수 있지만, 계획/프롬프트(입력)는 계속 축적·개선되는 누적 자산
  • 입력부(플랜, 프롬프트)에서 디버깅하면 앞으로의 모든 작업에 확장 가능
  • 에이전트를 단순 생성기가 아닌 스스로 학습하고 협업하는 존재로 변화시킴
  • 예: 전체 CSV를 메모리에 올리는 코드를 스트림 처리로 변경하게 하고, 이후 모든 CSV에 해당 패턴을 플랜에 반영해 차후 자동 검증 가능해짐

팩토리 확장과 에이전트 협업

  • MCP로 전문화된 에이전트들을 각기 다른 작업에 배정하고 병렬화함
    • 예: Clojure 코드 전체를 모아 로컬 스타일 규칙 적용 전용 에이전트 운용, claude가 lint/test/debug 주기에서 발생하는 스타일 문제 보정
  • 내부 라이브러리 코드에서도, 예전 코드의 retry 및 Thread/sleep 사용을 자체 retry 라이브러리로 치환 등 생산성 및 일관성 강화
  • 작은 단위 에이전트들을 여러 개 구축해, 특정한 소작업별로 조합하여 복잡한 워크플로우도 자동화 가능
    • 예: API 명세와 비즈니스 케이스로부터, 에이전트 조합으로 통합, 테스트, 문서화까지 자동 처리
  • 핵심: 입력을 계속 수정해가며 반복 실행, 실패/정체/문맥 누락 시 다음 시도로 피드백 반영 후 개선
  • 코드 자체는 소모품, 진짜 자산은 지시사항(입력)과 에이전트 구성
  • 실패·정체·문맥 부족 등 모든 문제 교훈을 다음 입력에 반영해 팩토리 루프 완성

다음 단계 및 미래 방향

  • 에이전트 간 총괄 코디네이션을 강화해 전체 워크플로우 추적 및 자동화 도입 추진
  • 비즈니스 문서와 에이전트 정보를 잘 연결하고, 상위 수준의 추상화 정보 위주로 캡처하여 더 효과적으로 활용할 수 있도록 개선
  • 점점 복잡한 워크플로우를 구현하려고 하며, 에이전트간 협업 및 복잡한 상호작용 확대
  • 여러 공급자의 토큰 할당량 최대한 활용 및 손쉬운 전환(특히 bedrock sonnet 4의 토큰 제한 대응) 방안도 모색 중임

결론

  • 현재 AI 팩토리는 자동 코드 생성·검증이 일상화되어, 커피 한잔 동안에도 코드가 배포 가능
  • 아직 완전 자동화 단계는 아니나, "출력 수정 대신 입력 개선" 이라는 원칙이 팩토리의 본질로 자리 잡음

Read Entire Article