Claude Opus 4.7 : images haute résolution, task budgets et ruptures API

Claude Opus 4.7, disponible depuis le 16 avril 2026, est la version la plus capable de Claude en accès général à ce jour. Au-delà des gains de performance — 87,6 % sur SWE-bench Verified contre 80,8 % pour Opus 4.6, et 94,2 % sur GPQA Diamond — ce release introduit plusieurs ruptures d'API qui nécessitent une migration active pour tout projet utilisant l'API Messages.

Points clés

Images haute résolution : la résolution maximale passe de 1568 px / 1,15 MP à 2576 px / 3,75 MP. Les coordonnées renvoyées par le modèle sont désormais en pixels natifs 1:1 — plus de facteur d'échelle à calculer manuellement. Impact direct sur les workflows computer use et l'analyse de captures d'écran ou de documents.
Niveau d'effort xhigh : nouveau palier au-dessus de high, recommandé pour les tâches de codage intensives et les agents longue durée. À combiner avec thinking: {"type": "adaptive"} pour les cas complexes.
Task budgets (beta) : il est désormais possible de donner au modèle une enveloppe cible de tokens pour l'intégralité d'une boucle agentique (thinking + tool calls + output). Le modèle voit un compteur décroissant et priorise son travail en conséquence. Utile pour contraindre des agents en production sans couper brutalement via max_tokens.

response = client.beta.messages.create(
    model="claude-opus-4-7",
    max_tokens=128000,
    output_config={
        "effort": "xhigh",
        "task_budget": {"type": "tokens", "total": 64000},
    },
    messages=[{"role": "user", "content": "Refactorise et documente le module auth."}],
    betas=["task-budgets-2026-03-13"],
)

Adaptive thinking exclusif : le mode thinking: {"type": "enabled", "budget_tokens": N} est supprimé. Seul thinking: {"type": "adaptive"} est pris en charge, désactivé par défaut — à activer explicitement pour les tâches complexes.

Ruptures d'API (Messages API uniquement)

Trois changements cassants s'appliquent à l'API Messages ; Claude Managed Agents est inchangé :

temperature, top_p, top_k non-défaut → erreur 400. Tout code qui positionne ces paramètres doit les supprimer. Le prompting reste la voie recommandée pour guider le style ou la créativité.
Extended thinking budgets supprimés. thinking: {"type": "enabled", "budget_tokens": N} retourne une erreur 400. Migrer vers thinking: {"type": "adaptive"} combiné au paramètre effort.
Thinking content omis par défaut. Les blocs thinking ne contiennent plus le champ thinking sauf opt-in via "display": "summarized". Sans ce réglage, une interface qui streamait le raisonnement percevra une longue pause avant la réponse.

Piège à surveiller

Le nouveau tokenizer d'Opus 4.7 peut générer jusqu'à 35 % de tokens supplémentaires selon les contenus (texte structuré, code dense). Le tarif est inchangé (5 $/M tokens input, 25 $/M output), mais l'impact budgétaire peut surprendre sur des workloads verbeux. Revoir les seuils max_tokens, les triggers de compaction et les estimations de coût avant bascule en production.

La fenêtre de contexte est maintenue à 1 M de tokens sans supplément de prix pour les grands contextes.

Nouveautés Claude Opus 4.7 — documentation officielle

Annonce Anthropic

Comparatif benchmarks mai 2026 — LM Council