Roobia

Posted on Jun 10 • Originally published at apidog.com

Precios de Claude Fable 5: Desglose Completo de Costos (2026)

El precio de Claude Fable 5 comienza en $10 por millón de tokens de entrada y $50 por millón de tokens de salida en la API de Anthropic. Si vas a integrarlo en producción, no basta con conocer esas dos cifras: necesitas estimar tokens por solicitud, separar entrada y salida, considerar la ventana gratuita en planes de Claude y aplicar técnicas como caché, batch y límites de salida. Esta guía resume cómo calcular el costo real de Claude Fable 5, con ejemplos numéricos y pasos prácticos para controlar el gasto frente a alternativas más económicas como Claude Opus 4.8.

Prueba Apidog hoy

TL;DR

Claude Fable 5 cuesta:

Entrada: $10 por millón de tokens
Salida: $50 por millón de tokens

Desde el 9 de junio hasta el 22 de junio de 2026, está incluido sin costo adicional en los planes Pro, Max, Team y Enterprise basados en asientos.

A partir del 23 de junio de 2026, el uso en esos planes consume créditos de uso medido con las mismas tarifas de tokens: $10/$50 por millón.

Precios de Claude Fable 5 de un vistazo

Tipo de token	Precio por 1M de tokens	Precio por 1K de tokens	Qué incluye
Entrada	$10.00	$0.01	Prompt, mensaje del sistema, contexto, historial, documentos recuperados y definiciones de herramientas
Salida	$50.00	$0.05	Respuesta generada, razonamiento producido y argumentos de llamadas a herramientas

El ID del modelo en la API es:

claude-fable-5

La salida cuesta 5 veces más que la entrada. Esa relación es clave para optimizar costos: limitar respuestas largas suele ahorrar más que recortar unos pocos tokens del prompt.

Puedes verificar las tarifas actuales en la página de precios de Anthropic y en la documentación de modelos y precios.

Qué pagas en la API

Anthropic factura por separado:

Tokens de entrada
Tokens de salida

Los tokens de entrada incluyen todo lo que envías al modelo:

Prompt del usuario
Mensaje del sistema
Historial de conversación reutilizado
Contexto recuperado desde una base de datos o RAG
Documentos adjuntos
Definiciones JSON de herramientas

Los tokens de salida incluyen todo lo que el modelo devuelve:

Respuesta visible
Razonamiento generado
Argumentos de llamadas a herramientas

La fórmula base es:

costo = (tokens_entrada / 1,000,000 * 10) + (tokens_salida / 1,000,000 * 50)

Por ejemplo, una solicitud con:

2,000 tokens de entrada
600 tokens de salida

cuesta:

Entrada: 2,000 / 1,000,000 * 10 = $0.02
Salida: 600 / 1,000,000 * 50 = $0.03
Total: $0.05

No hay una tarifa plana adicional por solicitud. Pagas la suma de los tokens de entrada y salida de cada llamada.

Anthropic describe Fable 5 como “menos de la mitad del precio de Claude Mythos Preview”. El modelo hermano restringido, Claude Mythos 5, usa la misma tarifa de entrada y salida: $10/$50 por millón de tokens. Si quieres revisar el contexto del modelo antes de presupuestarlo, consulta qué es Claude Fable 5.

Inclusión en planes vs. créditos de uso

Los precios de la API no siempre equivalen a lo que pagas dentro de un plan de Claude. Las fechas importan.

Del 9 al 22 de junio de 2026

Claude Fable 5 está incluido sin costo adicional en los planes:

Pro
Max
Team
Enterprise basado en asientos

Durante esta ventana, puedes usar el modelo sin consumir saldo medido. Es una promoción de lanzamiento, no el estado permanente.

Desde el 23 de junio de 2026

Fable 5 sale del conjunto incluido en esos planes.

Después de esa fecha, el uso en Pro, Max, Team o Enterprise basado en asientos consume créditos de uso medido con las mismas tarifas de la API:

Entrada: $10 / 1M tokens
Salida: $50 / 1M tokens

Anthropic ha indicado que planea restaurar cierto acceso estándar cuando la capacidad lo permita, pero para presupuestar conviene asumir el modelo medido.

Los planes empresariales basados en consumo son distintos: Fable 5 está disponible desde el lanzamiento porque esos planes ya facturan por uso.

Si necesitas revisar las opciones de acceso, consulta cómo acceder a Claude Fable 5.

Conclusión práctica:

Si estás prototipando en Pro o Max antes del 22 de junio, aprovecha la ventana incluida.
Si vas a producción, calcula siempre con las tarifas de API: $10 entrada / $50 salida por millón de tokens.

Ejemplos prácticos de costo

La fórmula siempre es:

(tokens_entrada / 1,000,000) * 10 + (tokens_salida / 1,000,000) * 50

Ejemplo 1: un turno de chatbot de soporte

Supón un turno con:

1,500 tokens de entrada
500 tokens de salida

Cálculo:

Entrada: 1,500 / 1,000,000 * 10 = $0.015
Salida: 500 / 1,000,000 * 50 = $0.025
Total: $0.04 por turno

Si el bot procesa 1,000 turnos al día:

1,000 * $0.04 = $40/día

Aproximadamente:

$40 * 30 = $1,200/mes

Para chatbots, el costo por llamada puede parecer bajo, pero escala rápido con volumen.

Ejemplo 2: generación de código

Una solicitud de generación de código suele incluir más contexto:

Archivo actual
Fragmentos relacionados
Instrucciones
Requisitos de estilo o arquitectura

Supón:

8,000 tokens de entrada
3,000 tokens de salida

Cálculo:

Entrada: 8,000 / 1,000,000 * 10 = $0.08
Salida: 3,000 / 1,000,000 * 50 = $0.15
Total: $0.23 por solicitud

Aunque la entrada es mayor en tokens, la salida domina la factura porque cuesta 5x más.

Optimización directa:

Si reduces la salida de 3,000 a 1,500 tokens:
3,000 tokens salida = $0.15
1,500 tokens salida = $0.075

Ejemplo 3: agente de largo horizonte

Los agentes que leen repositorios, documentos o grandes bases de conocimiento pueden acumular mucho contexto.

Supón:

300,000 tokens de entrada
50,000 tokens de salida

Cálculo:

Entrada: 300,000 / 1,000,000 * 10 = $3.00
Salida: 50,000 / 1,000,000 * 50 = $2.50
Total: $5.50 por ejecución

Si ejecutas ese agente 200 veces al día:

200 * $5.50 = $1,100/día

Este tipo de carga de trabajo es donde más conviene usar caché de prompts, porque los agentes suelen reenviar contexto estable muchas veces.

Cómo reducir tu factura de Claude Fable 5

1. Usa caché de prompts

El almacenamiento en caché de prompts reduce el costo cuando reutilizas el mismo contexto.

Según las tarifas descritas:

Lecturas de caché: aproximadamente 0.1x el precio de entrada
Escrituras de caché: aproximadamente 1.25x el precio de entrada para un TTL de 5 minutos

En términos prácticos:

Entrada normal: ~$10 / 1M tokens
Lectura desde caché: ~$1 / 1M tokens
Escritura en caché: ~$12.50 / 1M tokens

Ejemplo con el agente anterior:

Entrada total: 300,000 tokens
Contexto estable cacheable: 250,000 tokens
Entrada nueva: 50,000 tokens

Sin caché:

300,000 / 1,000,000 * 10 = $3.00

Con caché:

250,000 / 1,000,000 * 1 = $0.25
50,000 / 1,000,000 * 10 = $0.50
Entrada total = $0.75

Costo total aproximado:

Entrada: $0.75
Salida: $2.50
Total: $3.25

Frente a $5.50 sin caché, el ahorro es significativo.

Úsalo cuando tengas:

Prompts de sistema grandes
Contexto de repositorio reutilizado
Documentos base repetidos
Agentes con múltiples pasos sobre el mismo contexto

2. Usa la API de lotes para trabajos no urgentes

Si tu tarea no necesita respuesta inmediata, la API de lotes puede reducir el costo aproximadamente un 50%.

Casos típicos:

Clasificación masiva
Procesamiento nocturno de documentos
Evaluaciones offline
Extracción estructurada sobre grandes volúmenes

Tarifas aproximadas con batch:

Entrada: ~$5 / 1M tokens
Salida: ~$25 / 1M tokens

Si puedes tolerar retraso, es una de las optimizaciones más simples.

3. Enruta tareas a modelos más baratos

No todas las solicitudes necesitan Fable 5.

Un patrón útil es implementar un enrutador:

Tareas simples       -> modelo más barato
Tareas rutinarias    -> Opus 4.8, Sonnet 4.6 o Haiku 4.5
Tareas difíciles     -> Claude Fable 5

Ejemplo de estrategia:

80% tráfico rutinario -> modelo más barato
20% tráfico complejo  -> Fable 5

Esto puede reducir más de la mitad de la factura si clasificas bien las tareas.

4. Limita `max_tokens`

La salida es el componente caro. Define max_tokens según la tarea real.

Ejemplo:

{
  "model": "claude-fable-5",
  "max_tokens": 800,
  "messages": [
    {
      "role": "user",
      "content": "Resume este documento en 5 bullets técnicos."
    }
  ]
}

No dejes salidas abiertas si solo necesitas:

Un JSON corto
Una lista de pasos
Una respuesta de soporte
Un resumen ejecutivo
Una clasificación

También puedes pedir explícitamente respuestas concisas:

Responde en máximo 6 bullets. No incluyas introducción ni conclusión.

5. Transmite respuestas y corta cuando sea suficiente

Streaming no cambia el precio por token, pero te permite detener la generación antes.

Útil cuando:

El usuario ya obtuvo la respuesta necesaria
La salida empieza a repetir información
Solo necesitas el primer resultado válido
Estás generando código y puedes cortar al cerrar el bloque esperado

Combinado con max_tokens, ayuda a evitar salidas innecesariamente largas.

Rastrea el gasto de Claude Fable 5 con Apidog

La forma más práctica de controlar costos durante el desarrollo es inspeccionar el uso de tokens en cada solicitud. Apidog es un cliente de API que puedes usar para enviar solicitudes a la API de Anthropic y revisar la respuesta completa.

Cuando llamas a claude-fable-5, la respuesta incluye un objeto usage con los contadores de tokens:

{
  "usage": {
    "input_tokens": 1500,
    "output_tokens": 500
  }
}

Con esos dos valores puedes calcular el costo exacto de la llamada:

costo_entrada = input_tokens * 0.00001
costo_salida  = output_tokens * 0.00005
costo_total   = costo_entrada + costo_salida

Ejemplo:

input_tokens  = 1500
output_tokens = 500

Entrada = 1500 * 0.00001 = $0.015
Salida  = 500 * 0.00005 = $0.025
Total   = $0.04

Flujo de trabajo recomendado:

Configura la solicitud de Anthropic en Apidog.
Guarda prompts representativos como ejemplos.
Ejecuta variantes del prompt.
Compara input_tokens y output_tokens.
Ajusta instrucciones, contexto y max_tokens.
Repite hasta tener un costo estable por caso de uso.

Esto te permite detectar rápido cuándo:

Un mensaje del sistema añade demasiados tokens.
Un formato de respuesta infla la salida.
El contexto recuperado por RAG es excesivo.
Una herramienta añade demasiado JSON al prompt.

Puedes descargar Apidog y combinarlo con la guía de la API de Claude Fable 5 para estructurar la solicitud. Si estás siguiendo la ventana gratuita, revisa también cómo usar Claude Fable 5 gratis.

Apidog también mantiene historial de solicitudes, lo que ayuda a comparar llamadas anteriores y estimar el costo de nuevas funciones antes de llevarlas a producción. Usar Apidog como capa de inspección durante el desarrollo reduce sorpresas cuando el tráfico aumenta.

Resumen operativo

Claude Fable 5 se calcula con dos números:

Entrada: $10 / 1M tokens
Salida:  $50 / 1M tokens

Para estimar tu costo real:

Mide input_tokens y output_tokens.
Aplica la fórmula por solicitud.
Multiplica por volumen diario o mensual.
Limita salidas con max_tokens.
Cachea contexto estable.
Usa batch para trabajos no urgentes.
Enruta tareas simples a modelos más baratos.

La ventana incluida en planes Pro, Max, Team y Enterprise basados en asientos termina el 22 de junio de 2026. Para producción, presupuesta desde ahora con créditos medidos.

El siguiente paso práctico es enviar una solicitud real a claude-fable-5, leer el objeto usage y calcular el costo con tus propios prompts. Descarga Apidog para probar la llamada y observar el costo en tiempo real.

DEV Community

Precios de Claude Fable 5: Desglose Completo de Costos (2026)

TL;DR

Precios de Claude Fable 5 de un vistazo

Qué pagas en la API

Inclusión en planes vs. créditos de uso

Del 9 al 22 de junio de 2026

Desde el 23 de junio de 2026

Ejemplos prácticos de costo

Ejemplo 1: un turno de chatbot de soporte

Ejemplo 2: generación de código

Ejemplo 3: agente de largo horizonte

Cómo reducir tu factura de Claude Fable 5

1. Usa caché de prompts

2. Usa la API de lotes para trabajos no urgentes

3. Enruta tareas a modelos más baratos

4. Limita `max_tokens`

5. Transmite respuestas y corta cuando sea suficiente

Rastrea el gasto de Claude Fable 5 con Apidog

Resumen operativo

Top comments (0)

TL;DR

Precios de Claude Fable 5 de un vistazo

Qué pagas en la API

Inclusión en planes vs. créditos de uso

Del 9 al 22 de junio de 2026

Desde el 23 de junio de 2026

Ejemplos prácticos de costo

Ejemplo 1: un turno de chatbot de soporte

Ejemplo 2: generación de código

Ejemplo 3: agente de largo horizonte

Cómo reducir tu factura de Claude Fable 5

1. Usa caché de prompts

2. Usa la API de lotes para trabajos no urgentes

3. Enruta tareas a modelos más baratos

4. Limita max_tokens

5. Transmite respuestas y corta cuando sea suficiente

Rastrea el gasto de Claude Fable 5 con Apidog

Resumen operativo

4. Limita `max_tokens`