- 복잡한 현실 세계 개발 작업을 겨냥한 에이전트형 코딩 모델로 Codex 환경에 맞춰 최적화
- 장시간 작업에서 컨텍스트 압축으로 맥락을 유지하며 리팩터링·마이그레이션 같은 큰 변경에 강해짐
- 네이티브 Windows 환경에서 전반 성능 개선과 함께 스크린샷·도면·차트·UI 해석을 돕는 비전 성능 강화
- SWE-Bench Pro와 Terminal-Bench 2.0에서 최고 수준 성능을 달성
- 방어 목적의 사이버 보안 역량을 크게 끌어올리면서도 오용 가능성을 고려해 유료 사용자 우선 제공과 신뢰 기반 접근을 병행하는 배포 방식 도입
개요
- GPT-5.2-Codex를 새롭게 공개. 복잡한 현실 세계 소프트웨어 엔지니어링 작업을 목표로 설계된 모델
- GPT-5.2를 기반으로 Codex 환경에서 에이전트형 코딩 작업에 최적화
- 컨텍스트 압축을 통해 장시간 진행 작업에서 안정적인 성능을 제공하며, 대규모 코드 변경 작업 역량이 강화
- Windows 환경에서 전반적 성능 개선이 이루어졌고 사이버 보안 역량도 강화
소프트웨어 엔지니어링의 경계를 확장하다
- GPT-5.2의 전문 지식 기반 업무 강점과 GPT-5.1-Codex-Max의 에이전트형 코딩·터미널 활용 성능을 토대로 개발된 모델
- 장기 컨텍스트 이해, 도구 호출 안정성, 정확성 개선, 네이티브 컴팩션을 바탕으로 장시간 코딩 작업에서 신뢰 가능한 파트너로 동작하는게 목표
- 추론 과정에서 토큰 효율성을 유지하는 방향이 함께 포함됨
- 비전 성능 강화를 통해 코딩 세션 중 공유되는 스크린샷, 기술 도면, 차트, UI 화면 해석 정확도를 높임
- GPT-5.1-Codex-Max에서 도입된 기능을 기반으로 네이티브 Windows에서도 에이전트형 코딩을 더 효과적이고 안정적으로 수행
벤치마크 성능
- SWE-Bench Pro와 Terminal-Bench 2.0에서 최고 수준 성능을 달성
- SWE-Bench Pro는 코드 리포지터리를 제공받아 현실적인 소프트웨어 엔지니어링 작업을 해결하는 패치를 생성하는 평가
- Terminal-Bench 2.0은 실제 터미널 환경에서 AI 에이전트 성능을 테스트하며 코드 컴파일, 모델 훈련, 서버 설정 작업이 포함
현실 세계의 사이버 보안
- 현대 사회의 핵심 시스템과 민감 데이터 보호를 위해 강력한 사이버 보안이 필수임
- 취약점이 오랜 기간 드러나지 않을 수 있으며, 발견·검증·수정 과정이 도구를 갖춘 엔지니어와 독립 보안 연구자 커뮤니티에 크게 의존
- 2025년 12월 11일 React 팀이 React 서버 컴포넌트 기반 앱에 영향을 미치는 보안 취약점 3개를 공개한 사례에서 취약점 자체뿐 아니라 발견 과정이 주목받았음
-
React 취약점 발견 사례
- Stripe 계열사 Privy의 보안 연구원 Andrew MacPherson이 Codex CLI에서 GPT-5.1-Codex-Max를 활용해 React2Shell 분석을 진행
- 로컬 테스트 환경 구성, 공격 표면 분석, 비정상 입력 기반 퍼징 등 표준 보안 워크플로로 Codex를 활용
- React2Shell 재현 과정에서 예상치 못한 동작이 확인되었고, 일주일 만에 이전에 알려지지 않았던 취약점 3개 발견으로 이어짐
- 발견된 취약점이 책임 있는 방식으로 React 팀에 공개됨
- 보안 연구자의 취약점 검증 과정이 얼마나 단축될 수 있는지 보여주는 사례로 Codex 세션 공유도 포함
계속해서 발전하는 사이버 보안 역량
- GPT-5-Codex부터 사이버 보안 역량이 크게 향상되기 시작했고 GPT-5.1-Codex-Max에서 큰 도약, GPT-5.2-Codex에서도 뚜렷한 개선이 확인됨
- 향후 모델도 같은 흐름을 이어갈 것으로 예상하며, 준비성 평가 체계에서 사이버 보안 역량 ‘높음’ 단계 도달 가능성을 전제로 계획과 평가를 진행 중
- GPT-5.2-Codex는 아직 ‘높음’ 단계에는 이르지 않았지만 향후 기준을 넘어설 모델까지 염두에 두고 준비를 이어가고 있음
결론
- GPT-5.2-Codex는 소프트웨어 엔지니어링과 사이버 보안 영역에서 고급 AI의 기여 방식이 확장되는 흐름을 보여줌
- 개발자와 보안 책임자가 복잡하고 장기적인 과제를 해결하도록 지원하는 동시에 책임 있는 보안 연구 도구 역시 한층 강화