DEV Community

Cover image for Claude Sonnet 5 Precios: El Desglose Completo de Costos (2026)
Roobia
Roobia

Posted on • Originally published at apidog.com

Claude Sonnet 5 Precios: El Desglose Completo de Costos (2026)

Claude Sonnet 5 se lanzó el 30 de junio de 2026, y el punto clave para equipos que consumen la API es el costo. Ofrece rendimiento cercano a Opus 4.8 en tareas de agentes y uso de herramientas, pero con una tarifa menor. En esta guía verá las tarifas exactas, cuándo cambia el precio introductorio, cómo el nuevo tokenizador puede modificar su factura real y cómo comparar Sonnet 5 con Opus 4.8 y Fable 5. Cuando empiece a probar llamadas reales, Apidog le permite enviar solicitudes, guardarlas y revisar el uso de tokens por respuesta.

Prueba Apidog hoy

Esto es lo que debe implementar antes de escalar: calcular costo por solicitud, volver a contar tokens con Sonnet 5, comparar modelos por tarifa y monitorear el bloque usage en cada respuesta.

Precios de Claude Sonnet 5 de un vistazo

Sonnet 5 mantiene la misma tarifa estándar por token que Sonnet 4.6. La diferencia está en el descuento introductorio, disponible durante los primeros dos meses.

Tarifa Entrada por 1M de tokens Salida por 1M de tokens En vigor
Introductoria $2 $10 Hasta el 31 de agosto de 2026
Estándar $3 $15 A partir del 1 de septiembre de 2026

El ID del modelo es:

claude-sonnet-5
Enter fullscreen mode Exit fullscreen mode

Ese es el valor que debe enviar en el cuerpo de la solicitud a la API.

Tenga en cuenta dos reglas de facturación:

  • Hasta el 31 de agosto de 2026: entrada a $2 / salida a $10 por millón de tokens.
  • Desde el 1 de septiembre de 2026: entrada a $3 / salida a $15 por millón de tokens.

Si ya usa Sonnet 4.6, el precio estándar por token no sube al migrar. Pero eso no significa que cada solicitud cueste exactamente lo mismo, porque Sonnet 5 usa un tokenizador diferente.

La trampa del tokenizador: misma tarifa, más tokens

Sonnet 5 se lanza con un nuevo tokenizador. El mismo texto de entrada produce aproximadamente un 30% más de tokens que en Sonnet 4.6, es decir, cerca de 1.3 veces más.

No necesita cambiar la forma de la solicitud ni la respuesta. La API, el streaming y el formato del cuerpo JSON siguen igual. Lo que cambia es el conteo de tokens que se usa para facturar.

Ejemplo:

Un prompt que en Sonnet 4.6 tenía 10,000 tokens puede pasar a unos 13,000 tokens en Sonnet 5.

Escenario Tokens de entrada Tarifa Costo aproximado
Sonnet 4.6 10,000 $3 / 1M $0.030
Sonnet 5 introductorio 13,000 $2 / 1M $0.026
Sonnet 5 estándar 13,000 $3 / 1M $0.039

Durante el período introductorio, el descuento compensa en gran parte el aumento de tokens. Después del 31 de agosto, el mismo texto puede costar más que en Sonnet 4.6, aunque la tarifa por token sea igual.

Revise estos puntos antes de migrar:

  • Vuelva a contar tokens con Sonnet 5. No reutilice estimaciones generadas con Sonnet 4.6.
  • Revise los campos usage.input_tokens y usage.output_tokens en respuestas reales.
  • Ajuste max_tokens si sus salidas estaban cerca del límite.
  • Recuerde que una ventana de contexto de 1 millón de tokens puede contener menos texto promedio si el tokenizador genera más tokens.

Para medir prompts con el tokenizador actual, consulte la documentación de recuento de tokens de Anthropic. Para una primera llamada a la API y cómo leer usage, vea nuestra guía de la API de Claude Sonnet 5.

Cómo se compara Sonnet 5 con Opus 4.8 y Fable 5

Sonnet 5 está posicionado como modelo de alto volumen. Los tres modelos comparados comparten una ventana de contexto de 1 millón de tokens y salida máxima de 128K. La diferencia principal aquí es el precio.

Modelo ID del modelo Entrada por 1M Salida por 1M
Sonnet 5 introductorio claude-sonnet-5 $2 $10
Sonnet 5 estándar claude-sonnet-5 $3 $15
Sonnet 4.6 claude-sonnet-4-6 $3 $15
Opus 4.8 claude-opus-4-8 $5 $25
Fable 5 claude-fable-5 $10 $50

Según las cifras de lanzamiento de Anthropic, Sonnet 5 queda cerca de Opus 4.8 en tareas de agentes y uso de herramientas:

Benchmark Sonnet 5 Opus 4.8
SWE-bench Pro 63.2% 69.2%
Terminal-Bench 2.1 80.4% 82.7%
OSWorld-Verified 81.2% 83.4%

Opus mantiene ventaja, especialmente en razonamiento puro, donde se adelanta por unos 6 puntos. Pero para cargas intensivas en herramientas, Sonnet 5 ofrece un punto de costo más bajo.

Regla práctica:

  • Use Sonnet 5 para bucles de agentes, herramientas, generación de código y tareas de alto volumen donde el costo por llamada importa.
  • Use Opus 4.8 cuando la mejora de calidad justifique pagar $5 / $25 por millón de tokens.
  • Use Fable 5 cuando necesite el modelo más capaz de Anthropic ampliamente lanzado, no para ejecuciones masivas sensibles a costo.
  • Si migra desde Sonnet 4.6, compare con datos reales porque el tokenizador cambia el costo efectivo.

Para una comparación por tarea, consulte nuestro análisis de Sonnet 5 vs Opus 4.8. Para el modelo superior de la escalera, vea la guía de precios de Fable 5.

Pruebe y rastree solicitudes de Sonnet 5 con Apidog

Cada costo de Sonnet 5 viene de una solicitud HTTP: un POST a la API de Mensajes, con un cuerpo JSON, una clave de API y una respuesta que incluye tokens de entrada y salida.

Con Apidog, puede convertir esas llamadas en pruebas repetibles:

  • Enviar una solicitud a Sonnet 5 y revisar el bloque usage.
  • Guardar la solicitud en una colección compartida.
  • Usar variables de entorno para claves de prueba y producción.
  • Comparar cambios de prompt sin reescribir la llamada.
  • Añadir aserciones para detectar salidas demasiado largas antes de llegar a producción.
  • Simular endpoints para probar integraciones sin gastar tokens en cada ejecución local.

Ejemplo de llamada con la API de Mensajes de Anthropic:

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in two sentences."}
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

La respuesta incluye un objeto usage similar a este:

{
  "usage": {
    "input_tokens": 1234,
    "output_tokens": 256
  }
}
Enter fullscreen mode Exit fullscreen mode

Para calcular el costo de una llamada:

costo_entrada = input_tokens / 1_000_000 * tarifa_entrada
costo_salida  = output_tokens / 1_000_000 * tarifa_salida
costo_total   = costo_entrada + costo_salida
Enter fullscreen mode Exit fullscreen mode

Ejemplo con tarifa estándar de Sonnet 5:

input_tokens  = 13,000
output_tokens = 2,000

entrada = 13,000 / 1,000,000 * 3  = $0.039
salida  = 2,000 / 1,000,000 * 15  = $0.030

total = $0.069
Enter fullscreen mode Exit fullscreen mode

Repita este cálculo con sus prompts reales. Esa es la forma más segura de estimar el gasto antes de escalar.

Descargue Apidog para enviar solicitudes de Sonnet 5, inspeccionar el uso de tokens y organizar las llamadas por las que está facturando en un solo espacio de trabajo.

Lista de verificación para estimar costos

Antes de pasar Sonnet 5 a producción:

  • [ ] Recuente tokens con Sonnet 5, no con Sonnet 4.6.
  • [ ] Mida input_tokens y output_tokens en respuestas reales.
  • [ ] Calcule costo por solicitud con tarifa introductoria y tarifa estándar.
  • [ ] Revise max_tokens para evitar salidas innecesariamente largas.
  • [ ] Compare Sonnet 5 contra Opus 4.8 solo en tareas donde la diferencia de calidad importe.
  • [ ] Guarde solicitudes representativas en una colección para que el equipo mida sobre los mismos casos.
  • [ ] Monitoree cambios de prompt que aumenten el tamaño de entrada o salida.

Preguntas frecuentes

¿Cuánto cuesta la API de Claude Sonnet 5?

Hasta el 31 de agosto de 2026, cuesta $2 por millón de tokens de entrada y $10 por millón de tokens de salida. A partir del 1 de septiembre de 2026, pasa a $3 por millón de tokens de entrada y $15 por millón de tokens de salida.

¿Es Sonnet 5 más barato que Sonnet 4.6?

Durante el período introductorio, sí tiene una tarifa menor. En la tarifa estándar, cuesta lo mismo por token que Sonnet 4.6: $3 / $15. Sin embargo, el nuevo tokenizador produce aproximadamente un 30% más de tokens para el mismo texto, por lo que una solicitud equivalente puede costar más. Nuestra comparación de Sonnet 5 vs Sonnet 4.6 cubre los detalles de migración.

¿Por qué el mismo prompt cuesta más en Sonnet 5 que en Sonnet 4.6?

Porque el tokenizador cambió. La tarifa por token puede ser la misma, pero si el mismo texto se convierte en aproximadamente 1.3 veces más tokens, el costo final sube.

¿Cómo se compara el precio de Sonnet 5 con Opus 4.8?

Opus 4.8 cuesta $5 por millón de tokens de entrada y $25 por millón de tokens de salida. Sonnet 5 cuesta $3 / $15 en tarifa estándar. En benchmarks de agentes informados por Anthropic, Sonnet 5 queda cerca de Opus 4.8, por lo que puede ser una opción más económica para trabajos intensivos en herramientas.

¿Existen formas más baratas de ejecutar Sonnet 5?

Sí. El procesamiento por lotes y el almacenamiento en caché de prompts pueden reducir la tarifa efectiva en cargas adecuadas. También ayuda mantener prompts concisos, limitar max_tokens y monitorear la salida, porque los tokens de salida cuestan 5 veces más que los de entrada.

Top comments (0)