Anthropic, Fable과 Mythos에 30일 데이터 보관 요구

1 hour ago 1
  • Mythos급 모델은 책임 있는 배포와 안전 작업을 위해 프롬프트와 출력을 30일간 보관하고 검토 대상이 될 수 있음
  • 이 정책은 Mythos급 모델과 유사 역량을 가진 향후 covered models에 적용되며, 다른 모델 사용 조건은 영향을 받지 않음
  • 소비자 요금제는 이미 안전 목적의 입력·출력 보관이 적용되는 표면이므로 이번 변경의 영향을 받지 않음
  • ZDR을 설정한 조직은 Claude Console, Claude Enterprise의 Claude Code, AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry 경로에서 보관 설정이 필요할 수 있음
  • Anthropic은 다중 요청에 걸친 오용 패턴 탐지를 위해 임시 보관이 필요하며, 30일 후 자동 삭제와 제한적 검토 절차를 적용함

적용 대상

  • Mythos급 모델의 책임 있는 배포를 위해 제한적 데이터 보관과 검토가 안전 작업의 일부로 요구됨
  • Mythos급 모델에 제출된 프롬프트와 생성된 출력은 해당 모델이 제공되는 모든 플랫폼에서 신뢰·안전 목적상 30일간 보관
  • 이 정책은 Mythos급 모델과 Anthropic이 지정하는 유사 역량의 향후 covered models에 적용됨
  • 다른 모든 모델의 사용은 영향을 받지 않으며 현재 조건이 유지됨
  • 정책은 2026년 6월 9일부터 적용됨

누구에게 적용되는가

  • Claude Free, Pro, Max 등 소비자 요금제는 웹, 데스크톱, 모바일 앱 전반에서 이번 변경의 영향을 받지 않음
  • Claude.ai와 Claude Code를 포함한 소비자 표면에서는 이미 안전 목적의 입력·출력 보관이 이루어짐
  • 변경 대상은 Claude Console에서 zero data retention(ZDR) 워크스페이스를 설정한 조직으로 제한됨
  • Claude Enterprise에서 ZDR로 Claude Code를 쓰거나, AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry를 통해 ZDR로 Claude에 접근하는 조직도 변경 대상임
  • 나머지 본문은 이러한 조직에만 적용됨

왜 필요한가

  • Claude Mythos 5는 모델 역량이 크게 증가했으며, 일부 역량은 선의의 목적과 악의적 목적 모두에 쓰일 수 있음
  • Claude Fable 5는 Claude Mythos 5와 같은 기반 모델을 공유하지만, 특히 사이버와 바이오 영역에서 추가 보호 장치를 가짐
  • 이러한 보호 장치가 더 넓은 공유를 가능하게 하지만, 이 모델군에서는 오용 패턴을 찾기 위한 보수적 접근이 적용됨
  • 일부 공격은 여러 요청을 함께 봐야 드러나며, Best-of-N jailbreaking은 작동하는 프롬프트를 찾기 위해 수백 개의 약간 다른 프롬프트를 보냄
  • 국가 지원 스파이 활동이나 데이터 갈취 캠페인 같은 큰 오용 패턴은 안전 분류기가 많은 요청을 넓게 볼 때 드러남
  • 이런 위협 탐지는 프롬프트와 출력을 한 번에 하나씩이 아니라 함께 분석할 수 있도록 임시 보관을 필요로 함

데이터 보호 방식

  • Anthropic 직원은 잠재적 심각 피해로 표시되거나 고객의 서면 요청이 있는 경우가 아니면 대화에 접근할 수 없음
  • 검토는 승인된 소수의 검토자만 수행할 수 있으며, 도구는 내보내기·복사·다운로드를 막음
  • 모든 접근 사례는 검토자가 숨기거나 수정할 수 없는 변조 방지 로그에 기록됨
  • 데이터는 30일 후 자동 삭제되지만, 안전 조사에 속하거나 법적으로 보관해야 하는 드문 경우는 예외가 됨
  • 자격을 갖춘 조직은 고객 관리 암호화 키와 접근 투명성 감사 로그를 추가할 수 있음
  • Anthropic은 고객 데이터의 보안, 기밀성, 무결성을 보호하도록 설계된 기술적·조직적 조치를 갖춘 문서화된 정보보안 프로그램을 유지함
  • 위험 기반 프로그램은 알려진 위협 모델과 예상 위협 모델에 대응하도록 구축·진화하며 정기적으로 테스트됨
  • 보관 데이터의 위협 모델과 개인정보 보호 통제에 관한 자세한 내용은 Trust Center의 technical white paper에서 확인 가능함

설정이 필요한 경우

  • 이번 변경은 ZDR을 설정한 Claude Console 워크스페이스, Claude Enterprise의 ZDR 기반 Claude Code, AWS Bedrock·Google Cloud Agent Platform·Microsoft Foundry의 ZDR 접근 조직에만 적용됨
  • 다른 조직에는 변경 사항이 없으며 별도 설정이 필요하지 않음
  • 현재 데이터 보관 없이 Claude에 접근하는 조직은 지정 모델 사용을 위해 데이터 보관 설정이 필요함
  • 개발자가 Claude API를 쓰는 경우

    • Claude Platform을 통해 Anthropic에서 직접 쓰는 경우, covered models를 사용할 워크스페이스에서 개발자 콘솔의 Workspace > Manage > Privacy Controls로 보관을 켜야 함
    • 다른 ZDR 활성 워크스페이스는 ZDR을 유지함
    • AWS의 Claude Platform을 쓰는 경우, 직접 Claude API와 같은 방식으로 보관이 작동하며 워크스페이스 수준에서 설정됨
    • AWS의 Claude Platform에서 보관된 데이터는 동일한 통제 아래 Anthropic이 처리함
    • Amazon Bedrock을 쓰는 경우, 새 covered model 접근을 위해 보관을 활성화해야 하며 보관 데이터는 AWS에 남음
    • Google Cloud의 Agent Platform을 쓰는 경우, 새 covered model을 위해 보관을 활성화해야 하며 보관 데이터는 GCP 환경에 남음
    • Amazon Bedrock과 Google Cloud Agent Platform의 모델 제공 시 온보딩 세부 정보가 공유될 예정임
    • Azure Foundry의 Claude를 쓰는 경우, 보관은 각 Azure Subscription별로 설정됨
    • Azure Foundry에서 Zero Data Retention을 설정한 경우, 이 모델에 접근하려면 별도 Azure Subscription을 만들어 사용해야 함
  • 팀이 Claude Code를 쓰는 경우

    • Anthropic API를 통한 Claude Code의 데이터 처리 방식은 Claude Code가 동작하는 워크스페이스의 설정을 따름
    • 해당 워크스페이스에서 보관을 켜면 Claude Code가 지정 모델을 사용할 수 있음
    • 개발자가 직접 로그인하는 경우 조직의 Claude Code 워크스페이스에서 보관을 활성화해야 함
    • Amazon Bedrock 또는 Google Cloud Agent Platform을 통한 Claude Code는 클라우드 자격 증명을 사용하므로 클라우드 환경의 보관 설정을 따름
    • 클라우드 환경에서 보관을 활성화해야 하며, 보관 데이터는 제공자 환경에 남음
    • Amazon Bedrock 또는 Google Cloud Agent Platform을 통해 접근하는 Cowork에도 같은 기준이 적용됨
    • Claude Enterprise with ZDR에서는 Primary Owner가 관리 콘솔에서 보관 설정을 직접 바꿀 수 있는 제어 기능이 제공될 예정임
    • 프로덕션 조직을 아직 건드리고 싶지 않은 경우 별도 샌드박스 조직 설정 지원을 받을 수 있음
  • 팀이 Claude for Enterprise에서 Claude chat 또는 Cowork를 쓰는 경우

    • 이 표면들은 이미 표준 보관으로 운영되므로 새 모델이 제공되면 접근할 수 있음
Read Entire Article