El precio de Claude Fable 5 comienza en $10 por millón de tokens de entrada y $50 por millón de tokens de salida en la API de Anthropic. Si vas a integrarlo en producción, no basta con conocer esas dos cifras: necesitas estimar tokens por solicitud, separar entrada y salida, considerar la ventana gratuita en planes de Claude y aplicar técnicas como caché, batch y límites de salida. Esta guía resume cómo calcular el costo real de Claude Fable 5, con ejemplos numéricos y pasos prácticos para controlar el gasto frente a alternativas más económicas como Claude Opus 4.8.
TL;DR
Claude Fable 5 cuesta:
- Entrada: $10 por millón de tokens
- Salida: $50 por millón de tokens
Desde el 9 de junio hasta el 22 de junio de 2026, está incluido sin costo adicional en los planes Pro, Max, Team y Enterprise basados en asientos.
A partir del 23 de junio de 2026, el uso en esos planes consume créditos de uso medido con las mismas tarifas de tokens: $10/$50 por millón.
Precios de Claude Fable 5 de un vistazo
| Tipo de token | Precio por 1M de tokens | Precio por 1K de tokens | Qué incluye |
|---|---|---|---|
| Entrada | $10.00 | $0.01 | Prompt, mensaje del sistema, contexto, historial, documentos recuperados y definiciones de herramientas |
| Salida | $50.00 | $0.05 | Respuesta generada, razonamiento producido y argumentos de llamadas a herramientas |
El ID del modelo en la API es:
claude-fable-5
La salida cuesta 5 veces más que la entrada. Esa relación es clave para optimizar costos: limitar respuestas largas suele ahorrar más que recortar unos pocos tokens del prompt.
Puedes verificar las tarifas actuales en la página de precios de Anthropic y en la documentación de modelos y precios.
Qué pagas en la API
Anthropic factura por separado:
- Tokens de entrada
- Tokens de salida
Los tokens de entrada incluyen todo lo que envías al modelo:
- Prompt del usuario
- Mensaje del sistema
- Historial de conversación reutilizado
- Contexto recuperado desde una base de datos o RAG
- Documentos adjuntos
- Definiciones JSON de herramientas
Los tokens de salida incluyen todo lo que el modelo devuelve:
- Respuesta visible
- Razonamiento generado
- Argumentos de llamadas a herramientas
La fórmula base es:
costo = (tokens_entrada / 1,000,000 * 10) + (tokens_salida / 1,000,000 * 50)
Por ejemplo, una solicitud con:
- 2,000 tokens de entrada
- 600 tokens de salida
cuesta:
Entrada: 2,000 / 1,000,000 * 10 = $0.02
Salida: 600 / 1,000,000 * 50 = $0.03
Total: $0.05
No hay una tarifa plana adicional por solicitud. Pagas la suma de los tokens de entrada y salida de cada llamada.
Anthropic describe Fable 5 como “menos de la mitad del precio de Claude Mythos Preview”. El modelo hermano restringido, Claude Mythos 5, usa la misma tarifa de entrada y salida: $10/$50 por millón de tokens. Si quieres revisar el contexto del modelo antes de presupuestarlo, consulta qué es Claude Fable 5.
Inclusión en planes vs. créditos de uso
Los precios de la API no siempre equivalen a lo que pagas dentro de un plan de Claude. Las fechas importan.
Del 9 al 22 de junio de 2026
Claude Fable 5 está incluido sin costo adicional en los planes:
- Pro
- Max
- Team
- Enterprise basado en asientos
Durante esta ventana, puedes usar el modelo sin consumir saldo medido. Es una promoción de lanzamiento, no el estado permanente.
Desde el 23 de junio de 2026
Fable 5 sale del conjunto incluido en esos planes.
Después de esa fecha, el uso en Pro, Max, Team o Enterprise basado en asientos consume créditos de uso medido con las mismas tarifas de la API:
Entrada: $10 / 1M tokens
Salida: $50 / 1M tokens
Anthropic ha indicado que planea restaurar cierto acceso estándar cuando la capacidad lo permita, pero para presupuestar conviene asumir el modelo medido.
Los planes empresariales basados en consumo son distintos: Fable 5 está disponible desde el lanzamiento porque esos planes ya facturan por uso.
Si necesitas revisar las opciones de acceso, consulta cómo acceder a Claude Fable 5.
Conclusión práctica:
- Si estás prototipando en Pro o Max antes del 22 de junio, aprovecha la ventana incluida.
- Si vas a producción, calcula siempre con las tarifas de API: $10 entrada / $50 salida por millón de tokens.
Ejemplos prácticos de costo
La fórmula siempre es:
(tokens_entrada / 1,000,000) * 10 + (tokens_salida / 1,000,000) * 50
Ejemplo 1: un turno de chatbot de soporte
Supón un turno con:
- 1,500 tokens de entrada
- 500 tokens de salida
Cálculo:
Entrada: 1,500 / 1,000,000 * 10 = $0.015
Salida: 500 / 1,000,000 * 50 = $0.025
Total: $0.04 por turno
Si el bot procesa 1,000 turnos al día:
1,000 * $0.04 = $40/día
Aproximadamente:
$40 * 30 = $1,200/mes
Para chatbots, el costo por llamada puede parecer bajo, pero escala rápido con volumen.
Ejemplo 2: generación de código
Una solicitud de generación de código suele incluir más contexto:
- Archivo actual
- Fragmentos relacionados
- Instrucciones
- Requisitos de estilo o arquitectura
Supón:
- 8,000 tokens de entrada
- 3,000 tokens de salida
Cálculo:
Entrada: 8,000 / 1,000,000 * 10 = $0.08
Salida: 3,000 / 1,000,000 * 50 = $0.15
Total: $0.23 por solicitud
Aunque la entrada es mayor en tokens, la salida domina la factura porque cuesta 5x más.
Optimización directa:
Si reduces la salida de 3,000 a 1,500 tokens:
3,000 tokens salida = $0.15
1,500 tokens salida = $0.075
Ejemplo 3: agente de largo horizonte
Los agentes que leen repositorios, documentos o grandes bases de conocimiento pueden acumular mucho contexto.
Supón:
- 300,000 tokens de entrada
- 50,000 tokens de salida
Cálculo:
Entrada: 300,000 / 1,000,000 * 10 = $3.00
Salida: 50,000 / 1,000,000 * 50 = $2.50
Total: $5.50 por ejecución
Si ejecutas ese agente 200 veces al día:
200 * $5.50 = $1,100/día
Este tipo de carga de trabajo es donde más conviene usar caché de prompts, porque los agentes suelen reenviar contexto estable muchas veces.
Cómo reducir tu factura de Claude Fable 5
1. Usa caché de prompts
El almacenamiento en caché de prompts reduce el costo cuando reutilizas el mismo contexto.
Según las tarifas descritas:
- Lecturas de caché: aproximadamente 0.1x el precio de entrada
- Escrituras de caché: aproximadamente 1.25x el precio de entrada para un TTL de 5 minutos
En términos prácticos:
Entrada normal: ~$10 / 1M tokens
Lectura desde caché: ~$1 / 1M tokens
Escritura en caché: ~$12.50 / 1M tokens
Ejemplo con el agente anterior:
- Entrada total: 300,000 tokens
- Contexto estable cacheable: 250,000 tokens
- Entrada nueva: 50,000 tokens
Sin caché:
300,000 / 1,000,000 * 10 = $3.00
Con caché:
250,000 / 1,000,000 * 1 = $0.25
50,000 / 1,000,000 * 10 = $0.50
Entrada total = $0.75
Costo total aproximado:
Entrada: $0.75
Salida: $2.50
Total: $3.25
Frente a $5.50 sin caché, el ahorro es significativo.
Úsalo cuando tengas:
- Prompts de sistema grandes
- Contexto de repositorio reutilizado
- Documentos base repetidos
- Agentes con múltiples pasos sobre el mismo contexto
2. Usa la API de lotes para trabajos no urgentes
Si tu tarea no necesita respuesta inmediata, la API de lotes puede reducir el costo aproximadamente un 50%.
Casos típicos:
- Clasificación masiva
- Procesamiento nocturno de documentos
- Evaluaciones offline
- Extracción estructurada sobre grandes volúmenes
Tarifas aproximadas con batch:
Entrada: ~$5 / 1M tokens
Salida: ~$25 / 1M tokens
Si puedes tolerar retraso, es una de las optimizaciones más simples.
3. Enruta tareas a modelos más baratos
No todas las solicitudes necesitan Fable 5.
Un patrón útil es implementar un enrutador:
Tareas simples -> modelo más barato
Tareas rutinarias -> Opus 4.8, Sonnet 4.6 o Haiku 4.5
Tareas difíciles -> Claude Fable 5
Ejemplo de estrategia:
80% tráfico rutinario -> modelo más barato
20% tráfico complejo -> Fable 5
Esto puede reducir más de la mitad de la factura si clasificas bien las tareas.
4. Limita max_tokens
La salida es el componente caro. Define max_tokens según la tarea real.
Ejemplo:
{
"model": "claude-fable-5",
"max_tokens": 800,
"messages": [
{
"role": "user",
"content": "Resume este documento en 5 bullets técnicos."
}
]
}
No dejes salidas abiertas si solo necesitas:
- Un JSON corto
- Una lista de pasos
- Una respuesta de soporte
- Un resumen ejecutivo
- Una clasificación
También puedes pedir explícitamente respuestas concisas:
Responde en máximo 6 bullets. No incluyas introducción ni conclusión.
5. Transmite respuestas y corta cuando sea suficiente
Streaming no cambia el precio por token, pero te permite detener la generación antes.
Útil cuando:
- El usuario ya obtuvo la respuesta necesaria
- La salida empieza a repetir información
- Solo necesitas el primer resultado válido
- Estás generando código y puedes cortar al cerrar el bloque esperado
Combinado con max_tokens, ayuda a evitar salidas innecesariamente largas.
Rastrea el gasto de Claude Fable 5 con Apidog
La forma más práctica de controlar costos durante el desarrollo es inspeccionar el uso de tokens en cada solicitud. Apidog es un cliente de API que puedes usar para enviar solicitudes a la API de Anthropic y revisar la respuesta completa.
Cuando llamas a claude-fable-5, la respuesta incluye un objeto usage con los contadores de tokens:
{
"usage": {
"input_tokens": 1500,
"output_tokens": 500
}
}
Con esos dos valores puedes calcular el costo exacto de la llamada:
costo_entrada = input_tokens * 0.00001
costo_salida = output_tokens * 0.00005
costo_total = costo_entrada + costo_salida
Ejemplo:
input_tokens = 1500
output_tokens = 500
Entrada = 1500 * 0.00001 = $0.015
Salida = 500 * 0.00005 = $0.025
Total = $0.04
Flujo de trabajo recomendado:
- Configura la solicitud de Anthropic en Apidog.
- Guarda prompts representativos como ejemplos.
- Ejecuta variantes del prompt.
- Compara
input_tokensyoutput_tokens. - Ajusta instrucciones, contexto y
max_tokens. - Repite hasta tener un costo estable por caso de uso.
Esto te permite detectar rápido cuándo:
- Un mensaje del sistema añade demasiados tokens.
- Un formato de respuesta infla la salida.
- El contexto recuperado por RAG es excesivo.
- Una herramienta añade demasiado JSON al prompt.
Puedes descargar Apidog y combinarlo con la guía de la API de Claude Fable 5 para estructurar la solicitud. Si estás siguiendo la ventana gratuita, revisa también cómo usar Claude Fable 5 gratis.
Apidog también mantiene historial de solicitudes, lo que ayuda a comparar llamadas anteriores y estimar el costo de nuevas funciones antes de llevarlas a producción. Usar Apidog como capa de inspección durante el desarrollo reduce sorpresas cuando el tráfico aumenta.
Resumen operativo
Claude Fable 5 se calcula con dos números:
Entrada: $10 / 1M tokens
Salida: $50 / 1M tokens
Para estimar tu costo real:
- Mide
input_tokensyoutput_tokens. - Aplica la fórmula por solicitud.
- Multiplica por volumen diario o mensual.
- Limita salidas con
max_tokens. - Cachea contexto estable.
- Usa batch para trabajos no urgentes.
- Enruta tareas simples a modelos más baratos.
La ventana incluida en planes Pro, Max, Team y Enterprise basados en asientos termina el 22 de junio de 2026. Para producción, presupuesta desde ahora con créditos medidos.
El siguiente paso práctico es enviar una solicitud real a claude-fable-5, leer el objeto usage y calcular el costo con tus propios prompts. Descarga Apidog para probar la llamada y observar el costo en tiempo real.


Top comments (0)