Mistral Medium 3.5
6 hours ago
1
- 128B dense 모델은 instruction-following, reasoning, coding을 단일 가중치로 처리하며 public preview로 제공됨
- 256k context window와 요청별 reasoning effort 설정을 지원해 짧은 채팅 응답과 복잡한 agentic 실행을 같은 모델로 처리 가능함
- Vibe 코딩 세션은 클라우드에서 비동기 실행되고 여러 세션을 병렬로 돌릴 수 있으며, 로컬 CLI 세션은 history, task state, approval과 함께 클라우드로 teleport 가능함
- Le Chat의 Work mode는 Mistral Medium 3.5 기반 agentic mode로, connected tools와 documents, mailboxes, calendars의 context를 활용하고 민감한 작업에는 명시적 승인을 요청함
- 모델은 Le Chat 기본 모델이 되고 Vibe CLI에서 Devstral 2를 대체하며, API 가격은 input 100만 token당 $1.5, output 100만 token당 $7.5임
Mistral Medium 3.5 공개
- 비전 인코더는 다양한 이미지 크기와 aspect ratio를 처리하도록 scratch부터 학습됨
- SWE-Bench Verified에서 77.6% 를 기록해 Devstral 2와 Qwen3.5 397B A17B 같은 모델보다 앞섬
- τ³-Telecom에서는 91.4를 기록했고, 여러 도구 호출과 downstream code가 소비할 수 있는 structured output 생성에 초점을 맞춤
Vibe 원격 코딩 에이전트
- 코딩 세션이 이제 클라우드에서 비동기 실행되며, 긴 작업을 사용자가 자리를 비운 동안 계속 처리할 수 있음
- 여러 세션을 병렬 실행할 수 있어 agent가 진행하는 각 단계에서 개발자가 병목이 되지 않게 만듦
- 클라우드 에이전트는 Mistral Vibe CLI 또는 Le Chat에서 시작 가능함
- 실행 중에는 file diff, tool call, progress state, agent의 질문을 확인할 수 있음
- 로컬 CLI 세션은 클라우드로 teleport할 수 있으며, session history, task state, approval이 함께 이동함
개발 워크플로와 통합되는 구조
- Vibe는 개발팀이 이미 쓰는 시스템 사이에 위치하며, 필요한 지점마다 human-in-the-loop를 유지함
- GitHub에는 code와 pull request로 연결되고, Linear와 Jira에는 issue로 연결됨
- Sentry는 incident 처리에, Slack과 Teams 같은 앱은 reporting에 연결됨
- 각 코딩 세션은 isolated sandbox에서 실행되며, 광범위한 편집과 설치를 포함할 수 있음
- 작업이 끝나면 agent가 GitHub pull request를 열고 알림을 보낼 수 있어, 개발자는 모든 keystroke 대신 결과를 검토하게 됨
적합한 코딩 작업과 Le Chat 실행
- Vibe 원격 에이전트는 개발자의 판단은 필요하지만 시간을 많이 쓰는 well-defined work에 맞춰짐
- 대상 작업에는 module refactor, test generation, dependency upgrade, CI investigation, bug fix가 포함됨
- Workflows를 Mistral Studio에서 orchestrate해 Mistral Vibe를 Le Chat에서 사용할 수 있게 됨
- 이 기능은 내부 코딩 환경용으로 먼저 만들어졌고, 이후 enterprise customers를 위해 사용됨
- 이제 웹에서 코딩 작업을 시작할 수 있으며, 로컬 터미널에 묶이지 않고 여러 작업을 병렬 실행 가능함
- Le Chat에서 작성한 작업은 CLI와 웹이 쓰는 동일한 remote runtime에서 실행되고, 나중에 finished branch 또는 draft PR로 돌아옴
Le Chat의 Work mode
- Work mode는 Le Chat에서 복잡한 작업을 처리하는 agentic mode이며, 새로운 harness와 Mistral Medium 3.5로 구동됨
- agent가 assistant 자체의 execution backend가 되어 Le Chat이 읽기와 쓰기, 여러 도구의 동시 사용, multi-step project 처리를 수행함
-
도구 간 워크플로
- email, message, calendar를 한 번의 실행에서 따라잡을 수 있음
- 참석자 context, 최신 뉴스, source에서 가져온 talking point로 회의 준비 가능함
-
조사와 종합
- web, internal docs, connected tools 전반에서 주제를 조사할 수 있음
- 편집 후 export 또는 sending 가능한 structured brief나 report를 만들 수 있음
-
받은편지함과 팀 작업
- inbox triage와 reply draft 작성 가능함
- 팀과 고객 논의에서 Jira issue를 만들고, Slack으로 팀에 summary를 보낼 수 있음
- 세션은 일반적인 채팅 응답보다 오래 유지되며, 여러 turn과 trial-and-error를 거쳐 완료까지 계속 진행 가능함
- Work mode에서는 connector가 수동 선택이 아니라 기본으로 켜져 있어, documents, mailboxes, calendars, other systems의 context에 접근 가능함
- agent의 모든 동작은 보이며, 각 tool call과 thinking rationale을 확인할 수 있음
- 메시지 전송, 문서 작성, 데이터 수정 같은 민감한 작업은 권한에 따라 Le Chat이 명시적 승인을 요청함
제공 여부와 가격
- Mistral Medium 3.5는 Mistral Vibe와 Le Chat에서 제공됨
- Le Chat의 remote coding agents와 Work mode는 Pro, Team, Enterprise 요금제에서 Mistral Medium 3.5로 구동됨
- API 가격은 input token 100만 개당 $1.5, output token 100만 개당 $7.5임
- open weights는 Hugging Face에서 modified MIT license로 제공됨
- 프로토타이핑용으로 build.nvidia.com의 NVIDIA GPU-accelerated endpoint에서 호스팅됨
- scalable containerized inference microservice인 NVIDIA NIM으로도 제공됨
-
Homepage
-
개발자
- Mistral Medium 3.5