Mistral Medium 3.5

1 month ago 25

128B dense 모델은 instruction-following, reasoning, coding을 단일 가중치로 처리하며 public preview로 제공됨
256k context window와 요청별 reasoning effort 설정을 지원해 짧은 채팅 응답과 복잡한 agentic 실행을 같은 모델로 처리 가능함
Vibe 코딩 세션은 클라우드에서 비동기 실행되고 여러 세션을 병렬로 돌릴 수 있으며, 로컬 CLI 세션은 history, task state, approval과 함께 클라우드로 teleport 가능함
Le Chat의 Work mode는 Mistral Medium 3.5 기반 agentic mode로, connected tools와 documents, mailboxes, calendars의 context를 활용하고 민감한 작업에는 명시적 승인을 요청함
모델은 Le Chat 기본 모델이 되고 Vibe CLI에서 Devstral 2를 대체하며, API 가격은 input 100만 token당 $1.5, output 100만 token당 $7.5임

Mistral Medium 3.5 공개

비전 인코더는 다양한 이미지 크기와 aspect ratio를 처리하도록 scratch부터 학습됨
SWE-Bench Verified에서 77.6% 를 기록해 Devstral 2와 Qwen3.5 397B A17B 같은 모델보다 앞섬
τ³-Telecom에서는 91.4를 기록했고, 여러 도구 호출과 downstream code가 소비할 수 있는 structured output 생성에 초점을 맞춤

코딩 세션이 이제 클라우드에서 비동기 실행되며, 긴 작업을 사용자가 자리를 비운 동안 계속 처리할 수 있음
여러 세션을 병렬 실행할 수 있어 agent가 진행하는 각 단계에서 개발자가 병목이 되지 않게 만듦
클라우드 에이전트는 Mistral Vibe CLI 또는 Le Chat에서 시작 가능함
실행 중에는 file diff, tool call, progress state, agent의 질문을 확인할 수 있음
로컬 CLI 세션은 클라우드로 teleport할 수 있으며, session history, task state, approval이 함께 이동함

Vibe는 개발팀이 이미 쓰는 시스템 사이에 위치하며, 필요한 지점마다 human-in-the-loop를 유지함
GitHub에는 code와 pull request로 연결되고, Linear와 Jira에는 issue로 연결됨
Sentry는 incident 처리에, Slack과 Teams 같은 앱은 reporting에 연결됨
각 코딩 세션은 isolated sandbox에서 실행되며, 광범위한 편집과 설치를 포함할 수 있음
작업이 끝나면 agent가 GitHub pull request를 열고 알림을 보낼 수 있어, 개발자는 모든 keystroke 대신 결과를 검토하게 됨

Vibe 원격 에이전트는 개발자의 판단은 필요하지만 시간을 많이 쓰는 well-defined work에 맞춰짐
대상 작업에는 module refactor, test generation, dependency upgrade, CI investigation, bug fix가 포함됨
Workflows를 Mistral Studio에서 orchestrate해 Mistral Vibe를 Le Chat에서 사용할 수 있게 됨
이 기능은 내부 코딩 환경용으로 먼저 만들어졌고, 이후 enterprise customers를 위해 사용됨
이제 웹에서 코딩 작업을 시작할 수 있으며, 로컬 터미널에 묶이지 않고 여러 작업을 병렬 실행 가능함
Le Chat에서 작성한 작업은 CLI와 웹이 쓰는 동일한 remote runtime에서 실행되고, 나중에 finished branch 또는 draft PR로 돌아옴

Work mode는 Le Chat에서 복잡한 작업을 처리하는 agentic mode이며, 새로운 harness와 Mistral Medium 3.5로 구동됨
agent가 assistant 자체의 execution backend가 되어 Le Chat이 읽기와 쓰기, 여러 도구의 동시 사용, multi-step project 처리를 수행함
도구 간 워크플로
- email, message, calendar를 한 번의 실행에서 따라잡을 수 있음
- 참석자 context, 최신 뉴스, source에서 가져온 talking point로 회의 준비 가능함
조사와 종합
- web, internal docs, connected tools 전반에서 주제를 조사할 수 있음
- 편집 후 export 또는 sending 가능한 structured brief나 report를 만들 수 있음
받은편지함과 팀 작업
- inbox triage와 reply draft 작성 가능함
- 팀과 고객 논의에서 Jira issue를 만들고, Slack으로 팀에 summary를 보낼 수 있음
- 세션은 일반적인 채팅 응답보다 오래 유지되며, 여러 turn과 trial-and-error를 거쳐 완료까지 계속 진행 가능함
- Work mode에서는 connector가 수동 선택이 아니라 기본으로 켜져 있어, documents, mailboxes, calendars, other systems의 context에 접근 가능함
- agent의 모든 동작은 보이며, 각 tool call과 thinking rationale을 확인할 수 있음
- 메시지 전송, 문서 작성, 데이터 수정 같은 민감한 작업은 권한에 따라 Le Chat이 명시적 승인을 요청함

Mistral Medium 3.5는 Mistral Vibe와 Le Chat에서 제공됨
Le Chat의 remote coding agents와 Work mode는 Pro, Team, Enterprise 요금제에서 Mistral Medium 3.5로 구동됨
API 가격은 input token 100만 개당 $1.5, output token 100만 개당 $7.5임
open weights는 Hugging Face에서 modified MIT license로 제공됨
프로토타이핑용으로 build.nvidia.com의 NVIDIA GPU-accelerated endpoint에서 호스팅됨
scalable containerized inference microservice인 NVIDIA NIM으로도 제공됨