Mistral Medium 3.5 : 128B dense open-weights, agents cloud et 77,6 % sur SWE-Bench

Le 30 avril 2026, Mistral AI a annoncé simultanément Mistral Medium 3.5 et une refonte de son offre d'agents dans Mistral Vibe. La sortie intervient dans un contexte de concurrence intense entre fournisseurs cherchant à proposer des modèles à la fois capables au niveau frontier et hébergeables localement — un positionnement que Mistral a cultivé depuis sa création.

Medium 3.5 est un modèle dense de 128 milliards de paramètres, ce qui le distingue des architectures Mixture-of-Experts (MoE) dominantes chez les concurrents open-weights de grande taille. La densité implique des coûts d'inférence plus élevés par token mais une plus grande prévisibilité des performances et une meilleure compression des poids (quantization).

Points clés

128B paramètres, dense — fenêtre de contexte de 256 000 tokens
SWE-Bench Verified : 77,6 % — légèrement derrière Gemini 3.1 Pro Preview (78,8 %) mais devant les modèles open-weights précédents comme Devstral 2 et Qwen3.5 397B A17B
τ³-Telecom : 91,4 % — benchmark orienté tâches télécom complexes
Variante EAGLE (Mistral-Medium-3.5-128B-EAGLE) disponible pour l'inférence spéculative, réduisant la latence de génération
Open-weights sous licence MIT modifiée — auto-hébergement possible sur 4 GPU, détails de licence à vérifier dans le model card HuggingFace
Public preview via Mistral Vibe CLI et Le Chat

# Via Mistral API (python)
from mistralai import Mistral

client = Mistral(api_key="...")
response = client.chat.complete(
    model="mistral-medium-3.5-2026-04",
    messages=[{"role": "user", "content": "Écris un agent de revue de PR"}],
)

Agents distants dans Vibe

La nouveauté la plus structurante est l'introduction des remote agents dans Mistral Vibe. Contrairement aux agents locaux (exécution sur la machine du développeur), les agents distants tournent dans le cloud de Mistral, permettant de :

lancer plusieurs tâches de code en parallèle depuis le CLI ou Le Chat
récupérer les résultats sous forme de pull requests plutôt que d'exécutions brutes
démarrer un agent et revenir sur le résultat plus tard (mode asynchrone)

Le Chat introduit également un Work Mode (Preview) conçu pour des tâches longues nécessitant recherche, analyse et actions sur des outils connectés — concurrent direct de Claude's Projects et de l'interface OpenAI Operator.

Limites et points de vigilance

La mention "MIT modifiée" mérite attention : Mistral a historiquement utilisé différentes licences selon les modèles (Apache 2.0 pour Devstral, Mistral Research License pour certains modèles). Une licence "MIT modifiée" peut contenir des clauses d'attribution ou des restrictions commerciales non présentes dans le MIT standard — à lire avant tout déploiement en production.

Le pricing API a suscité des critiques dans la communauté : les tarifs de Medium 3.5 sont jugés élevés au regard de concurrents comparables en inférence partiellement quantifiée.

Enfin, 77,6 % sur SWE-Bench Verified reste en dessous des 87,6 % de Claude Opus 4.7 sorti mi-avril — le gap sur les tâches de code reste significatif avec les modèles propriétaires frontier.

Annonce officielle Mistral

Model card Mistral Docs

Poids sur HuggingFace