DEV Community

Cover image for Comparé Claude Haiku, Sonnet y Opus en AWS Bedrock: Haiku es 84% más barato
Keylin González
Keylin González

Posted on

Comparé Claude Haiku, Sonnet y Opus en AWS Bedrock: Haiku es 84% más barato

TL;DR

Lambda serverless que compara Claude Haiku 4.5 vs Sonnet 4.6 vs Opus 4.6 en AWS Bedrock.
Mide latencia, tokens y costo real en USD.

Resultado: Haiku es 84.5% más barato que Opus para tareas estándar.

📦 GitHub Repo | 💰 Costo por comparación: $0.044


Contexto

La semana pasada escribí sobre Precios de Bedrock: Lo que realmente vas a pagar.
Hoy los pongo a prueba con código real.

Arquitectura:

Test Event → Lambda (Python 3.14) → Bedrock Runtime
                                    ├─ Haiku 4.5
                                    ├─ Sonnet 4.6
                                    └─ Opus 4.6
                                         ↓
                              CloudWatch Logs (reporte)
Enter fullscreen mode Exit fullscreen mode

Setup: 100% desde AWS Console (sin IaC).
Tiempo: ~15 min.

Recordatorio rápido: Lambda es el servicio serverless de AWS que ejecuta código sin gestionar servidores. CloudWatch Logs es donde Lambda registra toda su actividad (errores, prints, métricas).


Los resultados

Prompt: "¿Qué es AWS Lambda y cuándo usarlo?"

CloudWatch Logs:

════════════════════════════════════════════════════════════
🔬 BEDROCK MODEL COMPARISON — RESULTADOS
════════════════════════════════════════════════════════════
📝 Prompt: ¿Qué es AWS Lambda y cuándo usarlo?
────────────────────────────────────────────────────────────

🤖 Claude Haiku 4.5 (fast)
   ⏱️  Latencia:  6,967.7 ms
   🔢 Tokens:    23 in / 791 out / 814 total
   💰 Costo:     $0.003978

🤖 Claude Sonnet 4.6 (balanced)
   ⏱️  Latencia:  22,057.6 ms
   🔢 Tokens:    23 in / 950 out / 973 total
   💰 Costo:     $0.014319

🤖 Claude Opus 4.6 (powerful)
   ⏱️  Latencia:  21,979.2 ms
   🔢 Tokens:    23 in / 1024 out / 1047 total
   💰 Costo:     $0.025715

────────────────────────────────────────────────────────────
📊 RESUMEN
────────────────────────────────────────────────────────────
   🏆 Más rápido:  Claude Haiku 4.5 (6,967.7 ms)
   💸 Más barato:  Claude Haiku 4.5 ($0.003978)
   📝 Más extenso: Claude Opus 4.6
   💰 Costo total: $0.044012
   📉 Ahorro Haiku vs Opus: 84.5%
════════════════════════════════════════════════════════════
Enter fullscreen mode Exit fullscreen mode

Tabla comparativa:

Modelo Latencia Tokens Costo vs Haiku
Haiku 4.5 7.0s 814 $0.003978 baseline
Sonnet 4.6 22.1s 973 $0.014319 3.6x más caro
Opus 4.6 22.0s 1047 $0.025715 6.5x más caro

Lo sorprendente

Haiku generó una respuesta completa:

  • Guía estructurada con Markdown
  • Tabla de ventajas/desventajas
  • Ejemplos de código Python
  • Casos de uso y anti-patrones

Opus NO justificó 6.5x el precio para este contenido.

🤔 Sonnet: Similar latencia a Opus, pero 3.6x más caro que Haiku. ¿Vale la pena?


Comparación de calidad

Extracto de Haiku:

# AWS Lambda: Guía Completa

## ¿Qué es AWS Lambda?

AWS Lambda es un servicio de **computación sin servidor (serverless)** que te permite ejecutar código sin provisionar ni administrar servidores. Solo pagas por el tiempo de ejecución real de tu código.

### Características principales:

- ⚡ Ejecución automática y escalable
- 💰 Pago por uso (duración + memoria)
- 🔄 Se ejecuta en respuesta a eventos
- 📦 Soporta múltiples lenguajes (Python, Node.js, Java, Go, C#, etc.)
- 🚀 Sin mantenimiento de infraestructura
Enter fullscreen mode Exit fullscreen mode

Extracto de Sonnet:

# AWS Lambda

## ¿Qué es?

AWS Lambda es un servicio de **computación sin servidor** (*serverless*) que ejecuta código en respuesta a eventos, sin necesidad de aprovisionar ni administrar servidores.

Tu código → Evento lo dispara → Lambda ejecuta → Pagas solo por lo que usas
Enter fullscreen mode Exit fullscreen mode

Extracto de Opus:

# AWS Lambda

## ¿Qué es?

**AWS Lambda** es un servicio de computación **serverless** (sin servidor) de Amazon Web Services que permite ejecutar código **sin aprovisionar ni administrar servidores**. Solo pagas por el tiempo de cómputo que consumes.

---

## ¿Cómo funciona?

Evento (trigger) → Lambda ejecuta tu función → Devuelve resultado

1. **Subes tu código** (Python, Node.js, Java, Go, C#, Ruby, etc.)
2. **Defines un trigger** (evento que dispara la función)
3. **Lambda se encarga del resto**: escalado, infraestructura, disponibilidad
Enter fullscreen mode Exit fullscreen mode

Conclusión: Los tres modelos explican el concepto correctamente con estructura similar. Las diferencias en formato y énfasis no justifican 6.5x el costo para este tipo de tarea.


¿Cuándo usar cada modelo?

Haiku 4.5 → 80% de casos de uso

  • Chatbots
  • Clasificación de texto
  • Resúmenes
  • Traducciones
  • Generación de contenido educativo

Sonnet 4.6 → Equilibrio

  • Tareas que requieren mejor razonamiento
  • Cuando Haiku no es suficiente pero Opus es overkill

Opus 4.6 → Solo cuando sea crítico

  • Análisis legal o médico
  • Razonamiento complejo
  • Código de producción crítico
  • Prompts muy ambiguos

Cómo replicarlo

Repo: GitHub

  1. Clona el repo
  2. Abre guia_setup_aws.py
  3. Sigue los 5 pasos (~15 min)
  4. Prueba con tus propios prompts

Archivos:

bedrock-comparison/
├── lambda_handler.py       # Código de la Lambda
├── guia_setup_aws.py       # Setup paso a paso
└── README.md
Enter fullscreen mode Exit fullscreen mode

Configuración Lambda:

  • Runtime: Python 3.14
  • Timeout: 1 min 30 seg
  • Memory: 128 MB

Costos:

  • Lambda: $0.00 (free tier)
  • Bedrock: ~$0.04 por comparación
  • Para gastar $1: necesitas ~33 invocaciones

Conclusión

Para la mayoría de aplicaciones, Haiku 4.5 es imbatible en calidad/precio.

Solo escala a Sonnet/Opus si tests A/B demuestran que la calidad extra justifica el costo.


💬 ¿Qué modelo usas tú? ¿Has notado diferencias de calidad que justifiquen el costo?

📦 GitHub Repo | 📝 Artículo anterior: Precios de Bedrock

Top comments (0)