Mistral Medium 3.5

6 hours ago 1
  • 128B dense 모델은 instruction-following, reasoning, coding을 단일 가중치로 처리하며 public preview로 제공됨
  • 256k context window와 요청별 reasoning effort 설정을 지원해 짧은 채팅 응답과 복잡한 agentic 실행을 같은 모델로 처리 가능함
  • Vibe 코딩 세션은 클라우드에서 비동기 실행되고 여러 세션을 병렬로 돌릴 수 있으며, 로컬 CLI 세션은 history, task state, approval과 함께 클라우드로 teleport 가능함
  • Le Chat의 Work mode는 Mistral Medium 3.5 기반 agentic mode로, connected tools와 documents, mailboxes, calendars의 context를 활용하고 민감한 작업에는 명시적 승인을 요청함
  • 모델은 Le Chat 기본 모델이 되고 Vibe CLI에서 Devstral 2를 대체하며, API 가격은 input 100만 token당 $1.5, output 100만 token당 $7.5임

Mistral Medium 3.5 공개

  • 비전 인코더는 다양한 이미지 크기와 aspect ratio를 처리하도록 scratch부터 학습됨
  • SWE-Bench Verified에서 77.6% 를 기록해 Devstral 2와 Qwen3.5 397B A17B 같은 모델보다 앞섬
  • τ³-Telecom에서는 91.4를 기록했고, 여러 도구 호출과 downstream code가 소비할 수 있는 structured output 생성에 초점을 맞춤

Vibe 원격 코딩 에이전트

  • 코딩 세션이 이제 클라우드에서 비동기 실행되며, 긴 작업을 사용자가 자리를 비운 동안 계속 처리할 수 있음
  • 여러 세션을 병렬 실행할 수 있어 agent가 진행하는 각 단계에서 개발자가 병목이 되지 않게 만듦
  • 클라우드 에이전트는 Mistral Vibe CLI 또는 Le Chat에서 시작 가능함
  • 실행 중에는 file diff, tool call, progress state, agent의 질문을 확인할 수 있음
  • 로컬 CLI 세션은 클라우드로 teleport할 수 있으며, session history, task state, approval이 함께 이동함

개발 워크플로와 통합되는 구조

  • Vibe는 개발팀이 이미 쓰는 시스템 사이에 위치하며, 필요한 지점마다 human-in-the-loop를 유지함
  • GitHub에는 code와 pull request로 연결되고, Linear와 Jira에는 issue로 연결됨
  • Sentry는 incident 처리에, Slack과 Teams 같은 앱은 reporting에 연결됨
  • 각 코딩 세션은 isolated sandbox에서 실행되며, 광범위한 편집과 설치를 포함할 수 있음
  • 작업이 끝나면 agent가 GitHub pull request를 열고 알림을 보낼 수 있어, 개발자는 모든 keystroke 대신 결과를 검토하게 됨

적합한 코딩 작업과 Le Chat 실행

  • Vibe 원격 에이전트는 개발자의 판단은 필요하지만 시간을 많이 쓰는 well-defined work에 맞춰짐
  • 대상 작업에는 module refactor, test generation, dependency upgrade, CI investigation, bug fix가 포함됨
  • WorkflowsMistral Studio에서 orchestrate해 Mistral Vibe를 Le Chat에서 사용할 수 있게 됨
  • 이 기능은 내부 코딩 환경용으로 먼저 만들어졌고, 이후 enterprise customers를 위해 사용됨
  • 이제 웹에서 코딩 작업을 시작할 수 있으며, 로컬 터미널에 묶이지 않고 여러 작업을 병렬 실행 가능함
  • Le Chat에서 작성한 작업은 CLI와 웹이 쓰는 동일한 remote runtime에서 실행되고, 나중에 finished branch 또는 draft PR로 돌아옴

Le Chat의 Work mode

  • Work mode는 Le Chat에서 복잡한 작업을 처리하는 agentic mode이며, 새로운 harness와 Mistral Medium 3.5로 구동됨
  • agent가 assistant 자체의 execution backend가 되어 Le Chat이 읽기와 쓰기, 여러 도구의 동시 사용, multi-step project 처리를 수행함
  • 도구 간 워크플로

    • email, message, calendar를 한 번의 실행에서 따라잡을 수 있음
    • 참석자 context, 최신 뉴스, source에서 가져온 talking point로 회의 준비 가능함
  • 조사와 종합

    • web, internal docs, connected tools 전반에서 주제를 조사할 수 있음
    • 편집 후 export 또는 sending 가능한 structured brief나 report를 만들 수 있음
  • 받은편지함과 팀 작업

    • inbox triage와 reply draft 작성 가능함
    • 팀과 고객 논의에서 Jira issue를 만들고, Slack으로 팀에 summary를 보낼 수 있음
    • 세션은 일반적인 채팅 응답보다 오래 유지되며, 여러 turn과 trial-and-error를 거쳐 완료까지 계속 진행 가능함
    • Work mode에서는 connector가 수동 선택이 아니라 기본으로 켜져 있어, documents, mailboxes, calendars, other systems의 context에 접근 가능함
    • agent의 모든 동작은 보이며, 각 tool call과 thinking rationale을 확인할 수 있음
    • 메시지 전송, 문서 작성, 데이터 수정 같은 민감한 작업은 권한에 따라 Le Chat이 명시적 승인을 요청함

제공 여부와 가격

  • Mistral Medium 3.5는 Mistral VibeLe Chat에서 제공됨
  • Le Chat의 remote coding agents와 Work mode는 Pro, Team, Enterprise 요금제에서 Mistral Medium 3.5로 구동됨
  • API 가격은 input token 100만 개당 $1.5, output token 100만 개당 $7.5
  • open weights는 Hugging Face에서 modified MIT license로 제공됨
  • 프로토타이핑용으로 build.nvidia.com의 NVIDIA GPU-accelerated endpoint에서 호스팅됨
  • scalable containerized inference microservice인 NVIDIA NIM으로도 제공됨
Read Entire Article