Claude Mythos Preview : le modèle frontier d'Anthropic dédié à la cybersécurité

Le 7 avril 2026, Anthropic a annoncé simultanément Claude Mythos Preview et Project Glasswing — deux face d'une même initiative : utiliser un modèle frontier extrêmement capable pour sécuriser les logiciels les plus critiques au monde, avant que des acteurs malveillants ne le fassent à leur place.

Pourquoi maintenant ?

Mythos Preview constitue une rupture nette avec les modèles précédents dans un domaine précis : la sécurité offensive. Lors de ses évaluations internes, le modèle a identifié des milliers de vulnérabilités zero-day dans chaque grand système d'exploitation et chaque navigateur majeur. Plus troublant encore, il a découvert et exploité de manière entièrement autonome une faille d'exécution de code à distance vieille de 17 ans dans FreeBSD (CVE-2026-4747), obtenant un contrôle complet sur le serveur ciblé.

Benchmarks : nouveaux records sur toute la ligne

Sur les évaluations les plus discriminantes, Mythos Preview établit des records mondiaux :

GPQA Diamond : 94,6 % — premier rang mondial (Gemini 3.1 Pro : 94,3 %)
SWE-bench Verified : 93,9 % — premier rang pour le code complexe
CyberGym : 83,1 % — premier rang sur les tâches de cybersécurité

Ces scores dépassent Claude Opus 4.7 (94,2 % sur GPQA Diamond) et GPT-5.5 sur les benchmarks de raisonnement scientifique.

Project Glasswing : une réponse industrielle collective

Face à ces capacités, Anthropic n'a pas choisi de rendre le modèle disponible au grand public. À la place, l'entreprise a lancé Project Glasswing : un consortium à invitation regroupant 12 organisations fondatrices :

AWS, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks

L'initiative est dotée de 100 millions de dollars en crédits d'usage accordés par Anthropic. Plus de 40 organisations supplémentaires construisant ou maintenant des infrastructures logicielles critiques ont également rejoint le programme.

Mythos Preview est disponible exclusivement pour les membres de Project Glasswing, à des fins défensives uniquement, via l'API Claude, Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry. La tarification est fixée à 25 $/M tokens en entrée et 125 $/M en sortie.

Ce que le modèle peut faire concrètement

Scénario validé :
- Analyse autonome d'une base de code C
- Identification d'un bug de corruption mémoire introduit en 2009
- Génération d'un exploit fonctionnel (heap overflow → RCE)
- Production d'un patch corrigeant la vulnérabilité

Selon le rapport de risque publié par Anthropic, ces capacités franchissent le seuil où un modèle peut apporter une aide substantielle à des acteurs souhaitant développer des cyberattaques significatives — ce qui justifie l'accès restreint.

Limites et questions de gouvernance

La décision d'Anthropic de ne pas rendre Mythos Preview accessible au public a suscité un débat. Bruce Schneier a analysé les implications de cette approche : concentrer des capacités offensives exceptionnelles dans un club fermé de grandes entreprises crée une asymétrie d'information inquiétante. Qui surveille les membres de Project Glasswing eux-mêmes ?

Par ailleurs, l'accès via invitation soulève des questions pratiques : les équipes de sécurité des PME, pourtant exposées aux mêmes menaces, n'auront pas accès à Mythos avant que la prochaine génération ne soit disponible. Le fossé entre les capacités IA des grands acteurs et celles des équipes indépendantes continue de se creuser.

Anthropic annonce que le déploiement à grande échelle de modèles de classe Mythos reste l'objectif à terme, une fois les garanties suffisantes établies. Project Glasswing est conçu comme un terrain d'expérimentation contrôlée pour y parvenir.

Source principale — red.anthropic.com