Anthropic a lancé Claude Opus 4.8 le 28 mai 2026 et l’a rendu disponible le même jour via l’API Claude, les applications Claude, Claude Code et les principales plateformes cloud. C’est le modèle le plus performant de la famille Claude, conçu pour le raisonnement complexe, le codage agentique à long terme et les workflows à haute autonomie. L’ID du modèle API est claude-opus-4-8.
Si vous utilisez déjà Opus 4.7, la migration consiste principalement à remplacer l’ID du modèle. Le prix et la fenêtre de contexte restent identiques. Le changement important concerne la qualité : selon l’annonce d’Anthropic, Opus 4.8 est environ quatre fois moins susceptible que 4.7 de laisser passer un défaut de code inaperçu, et il signale mieux ce qu’il ne sait pas.
Ce guide montre ce qui change, comment appeler le modèle et quoi tester avant de le déployer.
La version courte
À retenir avant de modifier votre code :
-
ID du modèle :
claude-opus-4-8 - Disponibilité : API Claude, AWS, Vertex AI et Microsoft Foundry
- Prix standard inchangé : 5 $ / million de jetons d’entrée, 25 $ / million de jetons de sortie
- Contexte inchangé : 1 million de jetons en entrée, 128 000 jetons en sortie
Ce que vous gagnez :
- Un paramètre
effortpour contrôler le compromis entre qualité, profondeur et coût en jetons - La pensée adaptative, où le modèle décide combien raisonner par requête
- Des workflows dynamiques dans Claude Code, avec orchestration de nombreux sous-agents
- De meilleurs appels d’outils et moins de défauts de code non détectés
Pour le calcul détaillé des coûts, consultez la répartition des prix d’Opus 4.8. Pour démarrer directement avec l’API, utilisez le guide de l’API Opus 4.8.
Migrer depuis Opus 4.7
Dans le cas le plus simple, remplacez uniquement l’ID du modèle :
- "model": "claude-opus-4-7"
+ "model": "claude-opus-4-8"
Exemple de requête minimale :
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-opus-4-8",
"max_tokens": 4096,
"messages": [
{
"role": "user",
"content": "Refactorise ce module et explique les changements importants."
}
]
}'
Avant de déployer, vérifiez surtout :
- Vos schémas d’outils.
- Votre parsing des réponses streamées.
- Vos limites de jetons.
- Vos tests d’intégration.
- Le comportement avec différents niveaux d’
effort.
Quoi de neuf dans Opus 4.8
Opus 4.8 conserve les spécifications principales de 4.7, mais améliore le modèle sous-jacent dans quatre domaines.
Qualité du code
Le modèle détecte plus souvent ses propres erreurs. Anthropic indique une réduction d’environ 4x des défauts de code qui passent la revue inaperçus par rapport à Opus 4.7.
Pour des agents de codage, cela signifie moins de bugs silencieux dans les diffs générés.
Honnêteté et alignement
Opus 4.8 signale plus facilement l’incertitude et fait moins d’affirmations non étayées. Anthropic rapporte aussi des taux plus faibles de tromperie et de coopération à des fins d’abus que 4.7.
Pour des agents qui exécutent des actions sans supervision constante, ce comportement est aussi important que les scores de benchmark.
Appels d’outils
Le modèle sélectionne les outils plus efficacement et évite davantage les appels inutiles.
Conséquences pratiques :
- Moins de latence dans les boucles agentiques
- Moins de jetons dépensés en arguments d’outils
- Moins de bruit dans les logs d’orchestration
Contrôle de l’effort
Le changement API le plus visible est le paramètre effort.
Contrôle de l’effort : un modèle, cinq vitesses
Le paramètre effort se configure dans output_config.
Valeurs disponibles :
lowmediumhighxhighmax
La valeur par défaut est high sur toutes les interfaces, y compris l’API et Claude Code.
Exemple :
{
"model": "claude-opus-4-8",
"max_tokens": 4096,
"messages": [
{
"role": "user",
"content": "Refactorise ce module."
}
],
"output_config": {
"effort": "xhigh"
}
}
Point important : effort affecte tous les jetons, pas uniquement le raisonnement.
Cela inclut :
- Le texte généré
- Les appels d’outils
- Les arguments de fonction
- Le raisonnement interne du modèle
En pratique :
| Niveau | Quand l’utiliser |
|---|---|
low |
Tâches simples, réponses courtes, faible coût |
medium |
Automatisations courantes avec faible complexité |
high |
Valeur par défaut pour les tâches sérieuses |
xhigh |
Codage, agents, analyse approfondie |
max |
Cas critiques où la qualité prime sur le coût |
Le guide d’Anthropic recommande de commencer à xhigh pour le codage et les tâches agentiques, puis de réduire seulement si vos évaluations confirment que la qualité reste acceptable. Les détails sont dans la documentation Anthropic sur l’effort.
Pensée adaptative : remplacer les budgets manuels
Opus 4.8 utilise la pensée adaptative.
Au lieu de définir manuellement un budget de raisonnement, vous utilisez :
{
"thinking": {
"type": "adaptive"
}
}
Le modèle décide ensuite quand raisonner et combien de jetons consacrer à cette étape.
Exemple avec effort :
{
"model": "claude-opus-4-8",
"max_tokens": 8192,
"thinking": {
"type": "adaptive"
},
"output_config": {
"effort": "xhigh"
},
"messages": [
{
"role": "user",
"content": "Analyse cette base de code et propose un plan de migration sécurisé."
}
]
}
À savoir avant migration : la pensée étendue manuelle avec budget_tokens n’est pas prise en charge sur Opus 4.8. Elle renvoie une erreur 400.
Si vous aviez ce type de configuration :
{
"thinking": {
"type": "enabled",
"budget_tokens": 20000
}
}
Remplacez-la par :
{
"thinking": {
"type": "adaptive"
},
"output_config": {
"effort": "xhigh"
}
}
La forme complète de la requête est détaillée dans le guide de l’API Opus 4.8.
Workflows dynamiques dans Claude Code
La nouveauté la plus visible côté Claude Code est l’arrivée des Workflows Dynamiques.
Ils permettent à une seule session de lancer de nombreux sous-agents parallèles pour gérer des tâches complexes et ramifiées. En arrière-plan, cela combine :
- Le niveau d’effort
xhigh - Des messages système en cours de conversation
- Une orchestration d’agents pendant l’exécution
Cette capacité donne à un agent orchestrateur la possibilité de créer des travailleurs au fur et à mesure que la tâche progresse.
Pour comprendre les mécanismes et créer un mode d’orchestration similaire via l’API brute, consultez l’analyse approfondie des Workflows Dynamiques de Claude Code. Pour le fonctionnement général des agents dans Claude Code, lisez aussi la présentation de l’architecture du harnais d’agent de Claude Code.
Points saillants des benchmarks
Les chiffres mis en avant par Anthropic concernent surtout les usages agentiques :
- Bat GPT-5.5 sur Super-Agent, un benchmark d’achèvement de tâches de bout en bout
- En tête du Legal Agent Benchmark, premier modèle à dépasser 10 % au total sur ce test
- 84 % sur Online-Mind2Web, un benchmark d’agent de navigation web
Ces scores mesurent des agents, pas uniquement des conversations. C’est cohérent avec le positionnement d’Opus 4.8 : raisonnement long, exécution d’outils, tâches complexes.
Pour une comparaison directe avec d’autres modèles de pointe, consultez Opus 4.8 vs GPT-5.5 vs Gemini 3.5. La comparaison plus ancienne Gemini 3.5 vs GPT-5.5 vs Opus 4.7 reste utile comme base de référence pour Opus 4.7.
Opus 4.8 vs Opus 4.7
| Attribut | Opus 4.7 | Opus 4.8 |
|---|---|---|
| ID API | claude-opus-4-7 |
claude-opus-4-8 |
| Prix entrée | 5 $ / 1M jetons | 5 $ / 1M jetons |
| Prix sortie | 25 $ / 1M jetons | 25 $ / 1M jetons |
| Fenêtre contextuelle | 1M jetons | 1M jetons |
| Sortie max. | 128K jetons | 128K jetons |
| Niveaux d’effort | faible à max | faible à max |
| Défauts de code passés | référence | ~4x moins |
| Honnêteté / alignement | référence | amélioré |
| Date limite de connaissance | Janv. 2026 | Janv. 2026 |
Les spécifications sont identiques volontairement. Vous payez le même tarif pour un modèle plus fiable. Pour la plupart des équipes, la migration est donc peu risquée, à condition de rejouer vos tests avant production.
Comment accéder à Claude Opus 4.8
Vous avez quatre options.
1. API Claude
Utilisez le modèle claude-opus-4-8 avec l’endpoint Messages.
Point de départ recommandé : guide de l’API Opus 4.8.
2. Applications Claude
Opus 4.8 est le modèle haut de gamme par défaut sur claude.ai pour les forfaits payants, avec un accès limité sur le forfait gratuit.
3. Claude Code
Opus 4.8 est disponible comme modèle principal dans Claude Code, avec les Workflows Dynamiques lorsque vous utilisez un mode à effort élevé.
4. Plateformes cloud
Le modèle est disponible sur :
- AWS Bedrock :
anthropic.claude-opus-4-8 - Vertex AI :
claude-opus-4-8 - Microsoft Foundry, avec une fenêtre contextuelle limitée à 200 000 jetons
Si vous voulez l’essayer sans abonnement API payant, le guide comment utiliser Opus 4.8 gratuitement couvre les options légitimes à faible coût.
Quand utiliser Opus 4.8
Utilisez Opus 4.8 lorsque la qualité justifie le coût :
- Sessions longues de codage agentique
- Revues de code où les bugs silencieux coûtent cher
- Agents autonomes avec décisions multi-étapes
- Workflows avec appels d’outils complexes
- Analyse de grands contextes
- Tâches nécessitant un raisonnement de pointe
Évitez-le pour :
- Classification simple
- Extraction courte et répétitive
- Réponses à faible valeur métier
- Workloads très sensibles à la latence
- Volumes élevés où un modèle plus petit suffit
Dans ces cas, utilisez un modèle moins coûteux ou baissez le niveau d’effort.
Checklist de migration
Avant de remplacer Opus 4.7 en production, suivez cette checklist.
1. Remplacer l’ID du modèle
- claude-opus-4-7
+ claude-opus-4-8
2. Ajouter output_config
Commencez avec xhigh pour les tâches de codage :
{
"output_config": {
"effort": "xhigh"
}
}
Puis testez high ou medium si vous devez réduire les coûts.
3. Remplacer budget_tokens
Supprimez les budgets manuels de pensée étendue :
- "thinking": {
- "type": "enabled",
- "budget_tokens": 20000
- }
+ "thinking": {
+ "type": "adaptive"
+ }
4. Rejouer vos prompts réels
Comparez :
- Qualité des réponses
- Nombre d’appels d’outils
- Taille des sorties
- Latence
- Coût par requête
- Respect des schémas JSON
5. Tester le streaming
Si vous utilisez le streaming, vérifiez que votre parser gère toujours :
- Les fragments de texte
- Les appels d’outils
- Les réponses liées à la pensée adaptative
- Les événements partiels
- Les erreurs d’API
6. Valider les schémas d’outils
Si vos agents appellent des fonctions, ajoutez des assertions sur les arguments générés.
Exemple de validation côté application :
import { z } from "zod";
const ToolArgsSchema = z.object({
file_path: z.string(),
patch: z.string(),
reason: z.string()
});
function validateToolArgs(args: unknown) {
const result = ToolArgsSchema.safeParse(args);
if (!result.success) {
throw new Error(`Arguments d’outil invalides: ${result.error.message}`);
}
return result.data;
}
Tester Opus 4.8 avant le déploiement
Un changement d’ID de modèle est simple, mais les effets peuvent toucher tout votre pipeline :
- Format des réponses
- Streaming
- Appels d’outils
- Taille des sorties
- Coût réel
- Temps de réponse
- Comportement agentique
Avant de pousser claude-opus-4-8 en production, rejouez vos requêtes réelles et comparez les sorties avec celles d’Opus 4.7.
Apidog permet de tester l’API Messages dans un seul espace de travail :
- Enregistrer l’endpoint Opus 4.8 comme requête
- Ajouter votre
x-api-key - Comparer
claude-opus-4-7etclaude-opus-4-8 - Visualiser les fragments streamés avec les timings
- Ajouter des assertions sur les schémas JSON
- Tester plusieurs niveaux d’
effort - Simuler l’endpoint pour tester le code aval sans consommer de crédits
Pour essayer rapidement :
- Téléchargez Apidog.
- Créez une requête vers l’endpoint Messages.
- Collez l’extrait
curldu guide de l’API. - Lancez la même requête avec
claude-opus-4-7, puis avecclaude-opus-4-8. - Comparez les réponses et les appels d’outils.
FAQ
Claude Opus 4.8 est-il meilleur qu’Opus 4.7 ?
Oui, en termes de qualité. Il détecte environ 4x plus de défauts de code, signale mieux l’incertitude et appelle les outils plus efficacement. Le prix, la fenêtre contextuelle et la sortie maximale restent identiques.
Combien coûte Opus 4.8 ?
En mode standard :
- 5 $ par million de jetons d’entrée
- 25 $ par million de jetons de sortie
Le mode rapide coûte 10 $ en entrée et 50 $ en sortie pour une sortie 2,5 fois plus rapide. Le calcul complet se trouve dans la répartition des prix.
Quelle est la fenêtre contextuelle d’Opus 4.8 ?
Sur l’API Messages synchrone :
- 1 million de jetons d’entrée
- Jusqu’à 128 000 jetons de sortie
L’API Batch prend en charge jusqu’à 300 000 jetons de sortie avec un en-tête bêta. Sur Microsoft Foundry, la fenêtre contextuelle est limitée à 200 000 jetons.
Opus 4.8 prend-il en charge la pensée étendue ?
Opus 4.8 utilise la pensée adaptative :
{
"thinking": {
"type": "adaptive"
}
}
La pensée manuelle avec budget_tokens n’est pas prise en charge et renvoie une erreur 400.
Qu’est-ce que le paramètre effort ?
effort est un paramètre dans output_config qui contrôle le nombre de jetons que Claude consacre au texte, aux appels d’outils et au raisonnement.
Niveaux disponibles :
lowmediumhighxhighmax
La valeur par défaut est high.
Puis-je utiliser Opus 4.8 gratuitement ?
Il n’y a pas de niveau API gratuit, mais vous pouvez l’essayer sur le forfait gratuit de claude.ai avec des limites, ou via des crédits d’essai. Consultez le guide d’accès gratuit.
Que sont les Workflows Dynamiques ?
Les Workflows Dynamiques sont une fonctionnalité de Claude Code qui lance de nombreux sous-agents parallèles dans une seule session. Ils s’appuient sur un effort xhigh et des messages système en cours de conversation. Les détails sont dans le guide des Workflows Dynamiques.


Top comments (0)