몇 달 전, 우리는 첫 번째 에이전트 기반 코딩 모델인 Composer 1을 출시했습니다. 그 이후로 모델의 코딩 능력에 상당한 개선을 이루었습니다. 새로 출시된 Composer 1.5는 일상적인 사용을 위해 속도와 지능 사이에서 강력한 균형을 이루고 있습니다. Composer 1.5는 동일한 사전 훈련 모델에서 강화 학습을 20배 더 확장하여 구축되었습니다. Composer 1.5의 사후 훈련에 투입된 컴퓨팅 자원은 기본 모델의 사전 훈련에 사용된 양을 훨씬 초과합니다. 확대 과정에서 코딩 능력은 지속적으로 향상되고 있습니다. 실제 코딩 문제를 기준으로 한 내부 벤치마크 측정 결과, 본 모델은 Composer 1을 빠르게 추월하며 성능이 지속적으로 상승하는 것으로 나타났습니다. 특히 난이도 높은 작업에서 개선 효과가 가장 두드러집니다. 컴포저 1.5는 사고 모델입니다. 질의에 응답하는 과정에서 모델은 사용자의 코드베이스를 추론하고 다음 단계를 계획하기 위해 사고 토큰을 생성합니다. 이러한 사고 단계가 모델의 지능에 핵심적임을 확인했습니다. 동시에 일상적인 사용을 위해 Composer 1.5의 속도와 상호작용성을 유지하고자 했습니다. 균형을 이루기 위해 모델은 쉬운 문제에서는 최소한의 사고로 신속하게 응답하도록 훈련되었으며, 어려운 문제에서는 만족스러운 답을 찾을 때까지 사고합니다. 장시간 실행 작업 처리를 위해 Composer 1.5는 자체 요약 기능을 갖추고 있습니다. 이를 통해 모델은 사용 가능한 컨텍스트가 소진된 상황에서도 해결책 탐색을 지속할 수 있습니다. 우리는 강화 학습(RL)의 일환으로 Composer 1.5에 자체 요약 능력을 훈련시켰는데, 훈련 중 컨텍스트가 소진될 때 유용한 요약문을 생성하도록 요청하는 방식입니다. 어려운 예제에서는 이 과정이 재귀적으로 여러 번 발생할 수 있습니다. 자동 요약 기능을 통해 모델은 문맥 길이 변화에도 원래 정확도를 유지할 수 있음을 확인했습니다. Composer 1.5는 Composer 1보다 훨씬 강력한 모델로, 대화형 사용에 권장합니다. 이 모델의 훈련 과정은 코딩을 위한 RL이 예측 가능한 지능 향상과 함께 지속적으로 확장 가능함을 입증합니다. 가격은 이곳에서 볼 수 있습니다 -> https://cursor.com/docs/models

2 hours ago
1










English (US) ·