지난 1년간 Anthropic는 다양한 산업 분야의 팀들과 함께 대형 언어 모델(LLM) 기반 에이전트를 구축해 왔음. 실질적으로 성공적인 에이전트 도입 사례들은 복잡한 프레임워크나 특화 라이브러리보다는 단순하고 조합 가능한 패턴에 기반을 두는 경향을 보였음. 본 포스트는 고객과의 협업 및 자체 개발 경험에서 얻은 인사이트와, 효과적 에이전트 구축을 위한 실질적 조언을 공유함. 에이전트는 다양한 방식으로 정의될 수 있음 Anthropic는 이 둘 모두를 에이전틱 시스템으로 분류하지만, 워크플로우와 에이전트 간의 중요한 아키텍처적 차이를 둠 이 포스트에서는 두 형태의 시스템에 대해 자세히 설명하며, 실무 적용 사례는 부록 1에서 다룸 애플리케이션 개발 시 최소한의 복잡성을 원칙으로 하여, 필요할 때만 점진적으로 복잡성을 추가함이 바람직함 에이전틱 시스템 구현을 쉽게 해주는 다양한 프레임워크가 존재함 이들 프레임워크는 LLM 호출, 도구 정의/파싱, 호출 체인 구성 등 저수준 작업을 간소화해줌. 하지만 과도한 추상화로 인해 실제 프롬프트·응답 흐름이 불투명해지거나, 불필요하게 복잡성이 늘어날 위험이 있음 예시 구현은 anthropic-cookbook에서 확인 가능함 Anthropic는 실제 운영 환경에서 자주 활용되는 에이전틱 시스템 패턴들을 소개함 에이전틱 시스템의 핵심은 검색, 도구, 메모리 등의 기능이 증강된 LLM임 최근 공개된 Model Context Protocol을 통해 다양한 써드파티 도구와 간단히 통합 가능 LLM 발전과 함께 실서비스에서 복잡한 입력, 추론·계획, 도구 사용, 에러 회복이 가능한 에이전트가 등장 사용자 명령/대화로 시작 → 태스크 명확화 후 자율적 실행 → 중간 체크포인트에서 피드백 가능 → 완료 또는 중단 조건에서 종료 실제 구현은 LLM이 환경 피드백(도구 결과, 코드 실행)을 참고해 반복하며, 도구 세트와 문서화가 핵심 적용 예시: SWE-bench 작업 해결을 위한 코딩 에이전트, Claude 기반 컴퓨터 사용 자동화 적용 범위: 정해진 경로나 단계 예측이 불가능한 오픈엔드 문제, 의사결정 신뢰 필요 상황 자율성 증가로 인한 비용·복합 에러 가능성 고려 필요, 샌드박스 테스트와 가드레일 필수 LLM 시스템의 성공은 복잡성이나 신기술이 아니라, 목적에 맞는 정확한 접근을 찾는 것임 간단한 프롬프트로 시작, 성과 평가와 반복 최적화, 단계적 복잡성 확장 에이전트 설계에서의 3대 원칙 프레임워크로 빠른 시작 가능하지만, 실제로는 추상화 레이어 최소화와 직접 구현 역량이 신뢰성·유지보수를 좌우함 고객 지원 분야는 챗봇 인터페이스와 툴 연동이 결합되어, 에이전트 적용에 자연스럽게 적합함 성공적으로 적용된 사례들은 사용량(성공 해결 기준) 기반 과금 모델로 에이전트 효과성을 검증함 소프트웨어 개발 환경에서도 문제 자동 해결 등 에이전트 활용도가 크게 향상됨 Anthropic 자체 구현 사례: SWE-bench Verified 벤치마크에서 실제 GitHub 이슈를 pull request 설명만으로 해결. 자동화 테스트 외에도 인간 검토는 시스템 전체요구 사항 부합 여부 확인에 여전히 중요 모든 에이전틱 시스템에서 도구는 핵심 요소임 모델이 작성 ‘함정’에 빠지지 않도록 충분한 토큰 확보 인터넷에서 많이 접한 자연스러운 포맷 사용 권장 불필요한 포맷팅 오버헤드(예: 코드 줄수 카운트, 문자열 이스케이프 등) 최소화 인간-컴퓨터 인터페이스(HCI)를 설계할 때 투자하는 만큼 에이전트-컴퓨터 인터페이스(ACI) 에도 정성을 들여야 함 모델 입장에서 도구를 이해·사용하는 것이 ‘명확’해야 하며, 사용 예시, 경계조건, 입력 포맷 명시 등도 포함 파라미터 이름, 설명도 직관적인 용어로 바꿔 설명서(도크스트링) 작성하듯 설계 다양한 입력값으로 실제 사용 방식 테스트 및 반복 개선 실수 발생을 줄일 수 있도록(Poka-yoke) 아규먼트 설계 실제 SWE-bench 에이전트 구축 시, 전체 프롬프트보다 도구 설계 최적화에 더 많은 시간 투자. 예시: 루트 폴더 이탈 후 파일 경로 실수를 줄이기 위해 절대경로만 받도록 변경 후 완벽하게 동작함.
개요
에이전트란 무엇인가
언제(그리고 언제 아닌가) 에이전트를 활용해야 하는가
프레임워크 사용 시점 및 방법
빌딩 블록, 워크플로우, 에이전트 패턴
빌딩 블록: 증강 LLM
워크플로우 유형별 설명
프롬프트 체이닝
라우팅
병렬화
오케스트레이터-워커스
평가-최적화 루프
에이전트
패턴 조합과 커스터마이즈
요약 및 권장 원칙
부록 1: 실무에서의 에이전트 적용 사례
고객 지원
코딩 에이전트
부록 2: 도구 프롬프트 엔지니어링 방법
도구 포맷 설계 팁