Antoine Laurent

Posted on Jun 10 • Originally published at apidog.com

Claude Fable 5 Prix : Répartition détaillée des coûts (2026)

Le prix de Claude Fable 5 commence à 10 $ par million de jetons d’entrée et 50 $ par million de jetons de sortie via l’API Anthropic. Pour budgétiser une intégration, il faut surtout suivre trois éléments : le volume de jetons envoyés, le volume de jetons générés et le mode d’accès utilisé, car les forfaits Claude Pro, Max, Team et Enterprise ont une fenêtre d’inclusion temporaire. Fable 5 a été lancé le 9 juin 2026, et Anthropic le positionne comme coûtant « moins de la moitié du prix de Claude Mythos Preview ». Ce guide vous montre comment calculer le coût réel d’un appel, estimer une charge de travail et réduire la facture avec le cache, les lots et le routage de modèles. Pour comparer avec des modèles moins chers, consultez aussi Claude Opus 4.8.

Essayez Apidog dès aujourd’hui

En bref

Claude Fable 5 coûte :

10 $ / 1M jetons d’entrée
50 $ / 1M jetons de sortie
0,01 $ / 1K jetons d’entrée
0,05 $ / 1K jetons de sortie

Du 9 au 22 juin 2026, il est inclus gratuitement dans les forfaits Pro, Max, Team et Enterprise basés sur le nombre de sièges.

À partir du 23 juin 2026, l’utilisation de Fable 5 sur ces forfaits est déduite des crédits d’utilisation mesurés aux mêmes tarifs que l’API : 10 $/50 $ par million de jetons.

Tarification de Claude Fable 5 en un coup d’œil

Type de jeton	Prix par 1M jetons	Prix par 1K jetons	Notes
Entrée	10,00 $	0,01 $	Invite, message système, contexte, historique, documents, définitions d’outils
Sortie	50,00 $	0,05 $	Réponse générée, raisonnement et arguments d’appels d’outils

L’ID du modèle API est :

claude-fable-5

Les jetons de sortie coûtent 5 fois plus cher que les jetons d’entrée. En pratique, cela signifie que limiter les réponses longues est souvent plus rentable que réduire légèrement l’invite.

Vous pouvez vérifier les tarifs actuels sur la page de tarification d’Anthropic et dans les documents sur les modèles et la tarification.

Ce que vous payez sur l’API

Anthropic facture séparément :

les jetons d’entrée ;
les jetons de sortie.

Jetons d’entrée

Les jetons d’entrée correspondent à tout ce que vous envoyez au modèle :

message utilisateur ;
message système ;
historique de conversation ;
contexte RAG ;
documents récupérés ;
définitions d’outils ;
JSON d’appels ou schémas.

Tarif :

10 $ / 1 000 000 jetons
0,01 $ / 1 000 jetons

Jetons de sortie

Les jetons de sortie correspondent à tout ce que le modèle génère :

réponse visible ;
raisonnement produit par le modèle ;
arguments d’appels d’outils ;
contenu intermédiaire renvoyé par l’API.

Tarif :

50 $ / 1 000 000 jetons
0,05 $ / 1 000 jetons

Formule de coût d’un appel

Pour une requête donnée :

coût = (input_tokens / 1 000 000) * 10
     + (output_tokens / 1 000 000) * 50

Exemple avec 2 000 jetons d’entrée et 600 jetons de sortie :

entrée = 2 000 / 1 000 000 * 10 = 0,02 $
sortie = 600 / 1 000 000 * 50 = 0,03 $

total = 0,05 $

Il n’y a pas de frais fixes par requête en plus. La facture est la somme des jetons d’entrée et de sortie sur tous vos appels.

Anthropic décrit Fable 5 comme « moins de la moitié du prix de Claude Mythos Preview ». Le modèle frère restreint, Claude Mythos 5, utilise les mêmes tarifs de 10 $ en entrée et 50 $ en sortie, donc passer de l’un à l’autre ne change pas le coût par jeton. Pour le contexte fonctionnel du modèle, consultez qu’est-ce que Claude Fable 5.

Inclusion dans le forfait vs crédits d’utilisation

La tarification API et la tarification dans les forfaits Claude ne suivent pas exactement la même logique.

Du 9 au 22 juin 2026

Claude Fable 5 est inclus sans frais supplémentaires dans les forfaits suivants basés sur le nombre de sièges :

Pro ;
Max ;
Team ;
Enterprise.

Pendant cette fenêtre, vous pouvez tester le modèle sans déduction d’un solde mesuré. C’est une promotion de lancement, pas l’état permanent.

À partir du 23 juin 2026

Fable 5 sort de l’ensemble inclus.

L’utilisation sur les forfaits Pro, Max, Team et Enterprise basés sur le nombre de sièges est alors déduite des crédits d’utilisation, aux mêmes tarifs que l’API :

10 $ / 1M jetons d’entrée
50 $ / 1M jetons de sortie

Anthropic a indiqué prévoir de rétablir un accès standard au forfait lorsque la capacité le permettra. Pour le moment, si vous budgétisez une intégration, utilisez les tarifs mesurés.

Forfaits Enterprise basés sur la consommation

Les forfaits Enterprise basés sur la consommation sont différents : Fable 5 y est disponible dès le lancement et l’utilisation est facturée dès le départ.

Si votre question porte sur l’accès plutôt que sur la facturation, consultez comment accéder à Claude Fable 5.

Exemples concrets de calcul

La formule reste toujours la même :

(input_tokens / 1 000 000) * 10 $
+
(output_tokens / 1 000 000) * 50 $

Exemple 1 : un tour de chatbot de support

Hypothèse :

1 500 jetons d’entrée ;
500 jetons de sortie.

Calcul :

entrée = 1 500 / 1 000 000 * 10 = 0,015 $
sortie = 500 / 1 000 000 * 50 = 0,025 $

total = 0,04 $

Coût estimé :

0,04 $ par tour

Pour 1 000 tours par jour :

1 000 * 0,04 $ = 40 $ / jour

Sur 30 jours :

40 * 30 = 1 200 $ / mois

Le coût par appel reste faible, mais le volume change rapidement l’ordre de grandeur.

Exemple 2 : génération de code

Hypothèse :

8 000 jetons d’entrée ;
3 000 jetons de sortie.

Cas typique : vous envoyez un fichier, quelques extraits connexes et une instruction détaillée.

Calcul :

entrée = 8 000 / 1 000 000 * 10 = 0,08 $
sortie = 3 000 / 1 000 000 * 50 = 0,15 $

total = 0,23 $

Même si l’entrée est presque trois fois plus grande que la sortie, la sortie domine la facture :

0,15 $ sur 0,23 $

C’est pourquoi vous devez limiter les réponses trop verbeuses avec max_tokens et des consignes de format précises.

Exemple 3 : agent long avec beaucoup de contexte

Hypothèse :

300 000 jetons d’entrée ;
50 000 jetons de sortie.

Ce type de charge apparaît lorsqu’un agent lit une base de code, rejoue du contexte récupéré et effectue plusieurs étapes.

Calcul :

entrée = 300 000 / 1 000 000 * 10 = 3,00 $
sortie = 50 000 / 1 000 000 * 50 = 2,50 $

total = 5,50 $

Pour 200 exécutions par jour :

200 * 5,50 $ = 1 100 $ / jour

C’est le type de workload où le cache d’invite peut réduire fortement la facture.

Comment réduire votre facture Claude Fable 5

Une fois Fable 5 choisi pour une tâche, optimisez d’abord les éléments mesurables : entrée, sortie, réutilisation du contexte et latence acceptable.

1. Utiliser la mise en cache des invites

La mise en cache est particulièrement utile lorsque vous réutilisez le même contexte :

grande invite système ;
documentation stable ;
instructions d’agent ;
contexte de projet ;
extraits de code communs.

Les lectures du cache coûtent environ 0,1 fois le prix d’entrée, soit environ :

1 $ / 1M jetons

au lieu de :

10 $ / 1M jetons

Les écritures dans le cache coûtent environ 1,25 fois le prix d’entrée, soit environ :

12,50 $ / 1M jetons

pour un TTL de 5 minutes.

Reprenons l’agent de l’exemple 3 :

300 000 jetons d’entrée ;
50 000 jetons de sortie ;
coût initial : 5,50 $.

Si 250 000 jetons d’entrée sont servis depuis le cache :

entrée cache = 250 000 / 1 000 000 * 1 = 0,25 $
entrée non cache = 50 000 / 1 000 000 * 10 = 0,50 $
sortie = 50 000 / 1 000 000 * 50 = 2,50 $

total = 3,25 $

Vous passez donc d’environ :

5,50 $ à 3,25 $

2. Utiliser l’API de lots pour les traitements non urgents

Pour les tâches qui n’exigent pas de réponse immédiate, l’API de lots peut réduire les coûts d’environ 50 %.

Cas adaptés :

classification en masse ;
extraction depuis des documents ;
enrichissement de données ;
analyse nocturne ;
génération hors ligne.

Les tarifs effectifs deviennent environ :

entrée : 5 $ / 1M jetons
sortie : 25 $ / 1M jetons

Si votre pipeline accepte un délai, c’est l’un des leviers les plus simples.

3. Router les requêtes vers le bon modèle

Toutes les requêtes ne justifient pas Fable 5.

Utilisez Fable 5 pour :

raisonnement complexe ;
tâches ambiguës ;
agents multi-étapes ;
génération de code difficile ;
analyse nécessitant une forte précision.

Envoyez les tâches plus simples vers des modèles moins chers comme :

Opus 4.8 ;
Sonnet 4.6 ;
Haiku 4.5.

Une stratégie fréquente consiste à mettre en place un routeur :

requête simple       -> modèle moins cher
requête moyenne      -> Sonnet / Opus
requête complexe     -> Fable 5
échec ou faible confiance -> Fable 5

Si 80 % du trafic part vers un modèle moins cher, la facture globale peut baisser fortement sans retirer Fable 5 des cas où il est utile.

4. Limiter `max_tokens`

La sortie coûte 50 $ / 1M jetons. Ne laissez pas les générations ouvertes si la tâche attend une réponse courte.

Exemple :

{
  "model": "claude-fable-5",
  "max_tokens": 800,
  "messages": [
    {
      "role": "user",
      "content": "Résume ce ticket en 5 puces maximum."
    }
  ]
}

Évitez les consignes vagues comme :

Explique en détail.

Préférez :

Réponds en 5 puces maximum. Chaque puce doit faire moins de 20 mots.

Réduire une génération de 3 000 jetons à 1 500 jetons divise par deux le coût de sortie de cet appel.

5. Streamer les réponses et arrêter tôt

Le streaming ne change pas le prix par jeton, mais il permet :

d’améliorer la latence perçue ;
d’arrêter la génération quand la réponse est suffisante ;
d’éviter de produire des sorties inutiles ;
de mieux contrôler les interfaces interactives.

Combiné à max_tokens, le streaming aide à éviter les longues réponses accidentelles.

Suivre les dépenses Claude Fable 5 avec Apidog

La manière la plus fiable de contrôler les coûts pendant le développement est de lire les jetons consommés sur chaque requête. Apidog peut servir de client API pour envoyer des requêtes à l’API Anthropic et inspecter la réponse complète.

Quand vous appelez claude-fable-5, la réponse inclut un objet usage avec les compteurs de jetons :

{
  "usage": {
    "input_tokens": 1500,
    "output_tokens": 500
  }
}

Vous pouvez convertir ces nombres en coût :

coût entrée = input_tokens * 0,00001
coût sortie = output_tokens * 0,00005
coût total = coût entrée + coût sortie

Exemple :

input_tokens = 1500
output_tokens = 500

entrée = 1500 * 0,00001 = 0,015 $
sortie = 500 * 0,00005 = 0,025 $

total = 0,04 $

Workflow recommandé

Créez une requête Anthropic dans Apidog.
Configurez le modèle claude-fable-5.
Enregistrez plusieurs invites représentatives.
Exécutez chaque variante.
Comparez input_tokens et output_tokens.
Calculez le coût par appel.
Multipliez par votre volume attendu.

Ce workflow permet d’identifier rapidement :

une invite système trop longue ;
un contexte RAG trop volumineux ;
un format de réponse trop verbeux ;
une génération qui dépasse le besoin réel ;
un appel d’outil qui ajoute beaucoup de JSON.

Vous pouvez télécharger Apidog pour configurer cette boucle d’inspection, puis suivre le guide de l’API Claude Fable 5 pour structurer votre requête. Si votre priorité est de tester sans frais pendant la période d’inclusion, consultez aussi comment utiliser Claude Fable 5 gratuitement.

Apidog conserve également un historique des requêtes. Vous pouvez donc revenir sur des appels passés, lire leurs compteurs de jetons et estimer le coût d’une nouvelle fonctionnalité à partir de données réelles. Utiliser Apidog comme couche d’inspection pendant le développement réduit le risque de découvrir les coûts seulement à la fin du mois.

Conclusion

La tarification de Claude Fable 5 repose sur deux chiffres :

10 $ / 1M jetons d’entrée
50 $ / 1M jetons de sortie

Pour budgétiser correctement :

mesurez input_tokens et output_tokens sur des requêtes réelles ;
appliquez la formule de coût ;
multipliez par votre volume attendu ;
activez le cache pour le contexte stable ;
utilisez les lots pour les tâches non urgentes ;
routez les tâches simples vers des modèles moins chers ;
limitez max_tokens pour contrôler la sortie.

Votre prochaine étape pratique : envoyez une requête claude-fable-5, lisez l’objet usage, puis calculez le coût exact de l’appel. Vous pouvez télécharger Apidog pour exécuter ce test et surveiller le coût en temps réel.

DEV Community

Claude Fable 5 Prix : Répartition détaillée des coûts (2026)

En bref

Tarification de Claude Fable 5 en un coup d’œil

Ce que vous payez sur l’API

Jetons d’entrée

Jetons de sortie

Formule de coût d’un appel

Inclusion dans le forfait vs crédits d’utilisation

Du 9 au 22 juin 2026

À partir du 23 juin 2026

Forfaits Enterprise basés sur la consommation

Exemples concrets de calcul

Exemple 1 : un tour de chatbot de support

Exemple 2 : génération de code

Exemple 3 : agent long avec beaucoup de contexte

Comment réduire votre facture Claude Fable 5

1. Utiliser la mise en cache des invites

2. Utiliser l’API de lots pour les traitements non urgents

3. Router les requêtes vers le bon modèle

4. Limiter `max_tokens`

5. Streamer les réponses et arrêter tôt

Suivre les dépenses Claude Fable 5 avec Apidog

Workflow recommandé

Conclusion

Top comments (0)

En bref

Tarification de Claude Fable 5 en un coup d’œil

Ce que vous payez sur l’API

Jetons d’entrée

Jetons de sortie

Formule de coût d’un appel

Inclusion dans le forfait vs crédits d’utilisation

Du 9 au 22 juin 2026

À partir du 23 juin 2026

Forfaits Enterprise basés sur la consommation

Exemples concrets de calcul

Exemple 1 : un tour de chatbot de support

Exemple 2 : génération de code

Exemple 3 : agent long avec beaucoup de contexte

Comment réduire votre facture Claude Fable 5

1. Utiliser la mise en cache des invites

2. Utiliser l’API de lots pour les traitements non urgents

3. Router les requêtes vers le bon modèle

4. Limiter max_tokens

5. Streamer les réponses et arrêter tôt

Suivre les dépenses Claude Fable 5 avec Apidog

Workflow recommandé

Conclusion

4. Limiter `max_tokens`