Le prix de Claude Fable 5 commence à 10 $ par million de jetons d’entrée et 50 $ par million de jetons de sortie via l’API Anthropic. Pour budgétiser une intégration, il faut surtout suivre trois éléments : le volume de jetons envoyés, le volume de jetons générés et le mode d’accès utilisé, car les forfaits Claude Pro, Max, Team et Enterprise ont une fenêtre d’inclusion temporaire. Fable 5 a été lancé le 9 juin 2026, et Anthropic le positionne comme coûtant « moins de la moitié du prix de Claude Mythos Preview ». Ce guide vous montre comment calculer le coût réel d’un appel, estimer une charge de travail et réduire la facture avec le cache, les lots et le routage de modèles. Pour comparer avec des modèles moins chers, consultez aussi Claude Opus 4.8.
Essayez Apidog dès aujourd’hui
En bref
Claude Fable 5 coûte :
- 10 $ / 1M jetons d’entrée
- 50 $ / 1M jetons de sortie
- 0,01 $ / 1K jetons d’entrée
- 0,05 $ / 1K jetons de sortie
Du 9 au 22 juin 2026, il est inclus gratuitement dans les forfaits Pro, Max, Team et Enterprise basés sur le nombre de sièges.
À partir du 23 juin 2026, l’utilisation de Fable 5 sur ces forfaits est déduite des crédits d’utilisation mesurés aux mêmes tarifs que l’API : 10 $/50 $ par million de jetons.
Tarification de Claude Fable 5 en un coup d’œil
| Type de jeton | Prix par 1M jetons | Prix par 1K jetons | Notes |
|---|---|---|---|
| Entrée | 10,00 $ | 0,01 $ | Invite, message système, contexte, historique, documents, définitions d’outils |
| Sortie | 50,00 $ | 0,05 $ | Réponse générée, raisonnement et arguments d’appels d’outils |
L’ID du modèle API est :
claude-fable-5
Les jetons de sortie coûtent 5 fois plus cher que les jetons d’entrée. En pratique, cela signifie que limiter les réponses longues est souvent plus rentable que réduire légèrement l’invite.
Vous pouvez vérifier les tarifs actuels sur la page de tarification d’Anthropic et dans les documents sur les modèles et la tarification.
Ce que vous payez sur l’API
Anthropic facture séparément :
- les jetons d’entrée ;
- les jetons de sortie.
Jetons d’entrée
Les jetons d’entrée correspondent à tout ce que vous envoyez au modèle :
- message utilisateur ;
- message système ;
- historique de conversation ;
- contexte RAG ;
- documents récupérés ;
- définitions d’outils ;
- JSON d’appels ou schémas.
Tarif :
10 $ / 1 000 000 jetons
0,01 $ / 1 000 jetons
Jetons de sortie
Les jetons de sortie correspondent à tout ce que le modèle génère :
- réponse visible ;
- raisonnement produit par le modèle ;
- arguments d’appels d’outils ;
- contenu intermédiaire renvoyé par l’API.
Tarif :
50 $ / 1 000 000 jetons
0,05 $ / 1 000 jetons
Formule de coût d’un appel
Pour une requête donnée :
coût = (input_tokens / 1 000 000) * 10
+ (output_tokens / 1 000 000) * 50
Exemple avec 2 000 jetons d’entrée et 600 jetons de sortie :
entrée = 2 000 / 1 000 000 * 10 = 0,02 $
sortie = 600 / 1 000 000 * 50 = 0,03 $
total = 0,05 $
Il n’y a pas de frais fixes par requête en plus. La facture est la somme des jetons d’entrée et de sortie sur tous vos appels.
Anthropic décrit Fable 5 comme « moins de la moitié du prix de Claude Mythos Preview ». Le modèle frère restreint, Claude Mythos 5, utilise les mêmes tarifs de 10 $ en entrée et 50 $ en sortie, donc passer de l’un à l’autre ne change pas le coût par jeton. Pour le contexte fonctionnel du modèle, consultez qu’est-ce que Claude Fable 5.
Inclusion dans le forfait vs crédits d’utilisation
La tarification API et la tarification dans les forfaits Claude ne suivent pas exactement la même logique.
Du 9 au 22 juin 2026
Claude Fable 5 est inclus sans frais supplémentaires dans les forfaits suivants basés sur le nombre de sièges :
- Pro ;
- Max ;
- Team ;
- Enterprise.
Pendant cette fenêtre, vous pouvez tester le modèle sans déduction d’un solde mesuré. C’est une promotion de lancement, pas l’état permanent.
À partir du 23 juin 2026
Fable 5 sort de l’ensemble inclus.
L’utilisation sur les forfaits Pro, Max, Team et Enterprise basés sur le nombre de sièges est alors déduite des crédits d’utilisation, aux mêmes tarifs que l’API :
10 $ / 1M jetons d’entrée
50 $ / 1M jetons de sortie
Anthropic a indiqué prévoir de rétablir un accès standard au forfait lorsque la capacité le permettra. Pour le moment, si vous budgétisez une intégration, utilisez les tarifs mesurés.
Forfaits Enterprise basés sur la consommation
Les forfaits Enterprise basés sur la consommation sont différents : Fable 5 y est disponible dès le lancement et l’utilisation est facturée dès le départ.
Si votre question porte sur l’accès plutôt que sur la facturation, consultez comment accéder à Claude Fable 5.
Exemples concrets de calcul
La formule reste toujours la même :
(input_tokens / 1 000 000) * 10 $
+
(output_tokens / 1 000 000) * 50 $
Exemple 1 : un tour de chatbot de support
Hypothèse :
- 1 500 jetons d’entrée ;
- 500 jetons de sortie.
Calcul :
entrée = 1 500 / 1 000 000 * 10 = 0,015 $
sortie = 500 / 1 000 000 * 50 = 0,025 $
total = 0,04 $
Coût estimé :
0,04 $ par tour
Pour 1 000 tours par jour :
1 000 * 0,04 $ = 40 $ / jour
Sur 30 jours :
40 * 30 = 1 200 $ / mois
Le coût par appel reste faible, mais le volume change rapidement l’ordre de grandeur.
Exemple 2 : génération de code
Hypothèse :
- 8 000 jetons d’entrée ;
- 3 000 jetons de sortie.
Cas typique : vous envoyez un fichier, quelques extraits connexes et une instruction détaillée.
Calcul :
entrée = 8 000 / 1 000 000 * 10 = 0,08 $
sortie = 3 000 / 1 000 000 * 50 = 0,15 $
total = 0,23 $
Même si l’entrée est presque trois fois plus grande que la sortie, la sortie domine la facture :
0,15 $ sur 0,23 $
C’est pourquoi vous devez limiter les réponses trop verbeuses avec max_tokens et des consignes de format précises.
Exemple 3 : agent long avec beaucoup de contexte
Hypothèse :
- 300 000 jetons d’entrée ;
- 50 000 jetons de sortie.
Ce type de charge apparaît lorsqu’un agent lit une base de code, rejoue du contexte récupéré et effectue plusieurs étapes.
Calcul :
entrée = 300 000 / 1 000 000 * 10 = 3,00 $
sortie = 50 000 / 1 000 000 * 50 = 2,50 $
total = 5,50 $
Pour 200 exécutions par jour :
200 * 5,50 $ = 1 100 $ / jour
C’est le type de workload où le cache d’invite peut réduire fortement la facture.
Comment réduire votre facture Claude Fable 5
Une fois Fable 5 choisi pour une tâche, optimisez d’abord les éléments mesurables : entrée, sortie, réutilisation du contexte et latence acceptable.
1. Utiliser la mise en cache des invites
La mise en cache est particulièrement utile lorsque vous réutilisez le même contexte :
- grande invite système ;
- documentation stable ;
- instructions d’agent ;
- contexte de projet ;
- extraits de code communs.
Les lectures du cache coûtent environ 0,1 fois le prix d’entrée, soit environ :
1 $ / 1M jetons
au lieu de :
10 $ / 1M jetons
Les écritures dans le cache coûtent environ 1,25 fois le prix d’entrée, soit environ :
12,50 $ / 1M jetons
pour un TTL de 5 minutes.
Reprenons l’agent de l’exemple 3 :
- 300 000 jetons d’entrée ;
- 50 000 jetons de sortie ;
- coût initial : 5,50 $.
Si 250 000 jetons d’entrée sont servis depuis le cache :
entrée cache = 250 000 / 1 000 000 * 1 = 0,25 $
entrée non cache = 50 000 / 1 000 000 * 10 = 0,50 $
sortie = 50 000 / 1 000 000 * 50 = 2,50 $
total = 3,25 $
Vous passez donc d’environ :
5,50 $ à 3,25 $
2. Utiliser l’API de lots pour les traitements non urgents
Pour les tâches qui n’exigent pas de réponse immédiate, l’API de lots peut réduire les coûts d’environ 50 %.
Cas adaptés :
- classification en masse ;
- extraction depuis des documents ;
- enrichissement de données ;
- analyse nocturne ;
- génération hors ligne.
Les tarifs effectifs deviennent environ :
entrée : 5 $ / 1M jetons
sortie : 25 $ / 1M jetons
Si votre pipeline accepte un délai, c’est l’un des leviers les plus simples.
3. Router les requêtes vers le bon modèle
Toutes les requêtes ne justifient pas Fable 5.
Utilisez Fable 5 pour :
- raisonnement complexe ;
- tâches ambiguës ;
- agents multi-étapes ;
- génération de code difficile ;
- analyse nécessitant une forte précision.
Envoyez les tâches plus simples vers des modèles moins chers comme :
- Opus 4.8 ;
- Sonnet 4.6 ;
- Haiku 4.5.
Une stratégie fréquente consiste à mettre en place un routeur :
requête simple -> modèle moins cher
requête moyenne -> Sonnet / Opus
requête complexe -> Fable 5
échec ou faible confiance -> Fable 5
Si 80 % du trafic part vers un modèle moins cher, la facture globale peut baisser fortement sans retirer Fable 5 des cas où il est utile.
4. Limiter max_tokens
La sortie coûte 50 $ / 1M jetons. Ne laissez pas les générations ouvertes si la tâche attend une réponse courte.
Exemple :
{
"model": "claude-fable-5",
"max_tokens": 800,
"messages": [
{
"role": "user",
"content": "Résume ce ticket en 5 puces maximum."
}
]
}
Évitez les consignes vagues comme :
Explique en détail.
Préférez :
Réponds en 5 puces maximum. Chaque puce doit faire moins de 20 mots.
Réduire une génération de 3 000 jetons à 1 500 jetons divise par deux le coût de sortie de cet appel.
5. Streamer les réponses et arrêter tôt
Le streaming ne change pas le prix par jeton, mais il permet :
- d’améliorer la latence perçue ;
- d’arrêter la génération quand la réponse est suffisante ;
- d’éviter de produire des sorties inutiles ;
- de mieux contrôler les interfaces interactives.
Combiné à max_tokens, le streaming aide à éviter les longues réponses accidentelles.
Suivre les dépenses Claude Fable 5 avec Apidog
La manière la plus fiable de contrôler les coûts pendant le développement est de lire les jetons consommés sur chaque requête. Apidog peut servir de client API pour envoyer des requêtes à l’API Anthropic et inspecter la réponse complète.
Quand vous appelez claude-fable-5, la réponse inclut un objet usage avec les compteurs de jetons :
{
"usage": {
"input_tokens": 1500,
"output_tokens": 500
}
}
Vous pouvez convertir ces nombres en coût :
coût entrée = input_tokens * 0,00001
coût sortie = output_tokens * 0,00005
coût total = coût entrée + coût sortie
Exemple :
input_tokens = 1500
output_tokens = 500
entrée = 1500 * 0,00001 = 0,015 $
sortie = 500 * 0,00005 = 0,025 $
total = 0,04 $
Workflow recommandé
- Créez une requête Anthropic dans Apidog.
- Configurez le modèle
claude-fable-5. - Enregistrez plusieurs invites représentatives.
- Exécutez chaque variante.
- Comparez
input_tokensetoutput_tokens. - Calculez le coût par appel.
- Multipliez par votre volume attendu.
Ce workflow permet d’identifier rapidement :
- une invite système trop longue ;
- un contexte RAG trop volumineux ;
- un format de réponse trop verbeux ;
- une génération qui dépasse le besoin réel ;
- un appel d’outil qui ajoute beaucoup de JSON.
Vous pouvez télécharger Apidog pour configurer cette boucle d’inspection, puis suivre le guide de l’API Claude Fable 5 pour structurer votre requête. Si votre priorité est de tester sans frais pendant la période d’inclusion, consultez aussi comment utiliser Claude Fable 5 gratuitement.
Apidog conserve également un historique des requêtes. Vous pouvez donc revenir sur des appels passés, lire leurs compteurs de jetons et estimer le coût d’une nouvelle fonctionnalité à partir de données réelles. Utiliser Apidog comme couche d’inspection pendant le développement réduit le risque de découvrir les coûts seulement à la fin du mois.
Conclusion
La tarification de Claude Fable 5 repose sur deux chiffres :
10 $ / 1M jetons d’entrée
50 $ / 1M jetons de sortie
Pour budgétiser correctement :
- mesurez
input_tokensetoutput_tokenssur des requêtes réelles ; - appliquez la formule de coût ;
- multipliez par votre volume attendu ;
- activez le cache pour le contexte stable ;
- utilisez les lots pour les tâches non urgentes ;
- routez les tâches simples vers des modèles moins chers ;
- limitez
max_tokenspour contrôler la sortie.
Votre prochaine étape pratique : envoyez une requête claude-fable-5, lisez l’objet usage, puis calculez le coût exact de l’appel. Vous pouvez télécharger Apidog pour exécuter ce test et surveiller le coût en temps réel.


Top comments (0)