Keylin González

Posted on Mar 11

Comparé Claude Haiku, Sonnet y Opus en AWS Bedrock: Haiku es 84% más barato

#aws #serverless #ai #python

TL;DR

Lambda serverless que compara Claude Haiku 4.5 vs Sonnet 4.6 vs Opus 4.6 en AWS Bedrock.
Mide latencia, tokens y costo real en USD.

Resultado: Haiku es 84.5% más barato que Opus para tareas estándar.

📦 GitHub Repo | 💰 Costo por comparación: $0.044

Contexto

La semana pasada escribí sobre Precios de Bedrock: Lo que realmente vas a pagar.
Hoy los pongo a prueba con código real.

Arquitectura:

Test Event → Lambda (Python 3.14) → Bedrock Runtime
                                    ├─ Haiku 4.5
                                    ├─ Sonnet 4.6
                                    └─ Opus 4.6
                                         ↓
                              CloudWatch Logs (reporte)

Setup: 100% desde AWS Console (sin IaC).
Tiempo: ~15 min.

Recordatorio rápido: Lambda es el servicio serverless de AWS que ejecuta código sin gestionar servidores. CloudWatch Logs es donde Lambda registra toda su actividad (errores, prints, métricas).

Los resultados

Prompt: "¿Qué es AWS Lambda y cuándo usarlo?"

CloudWatch Logs:

════════════════════════════════════════════════════════════
🔬 BEDROCK MODEL COMPARISON — RESULTADOS
════════════════════════════════════════════════════════════
📝 Prompt: ¿Qué es AWS Lambda y cuándo usarlo?
────────────────────────────────────────────────────────────

🤖 Claude Haiku 4.5 (fast)
   ⏱️  Latencia:  6,967.7 ms
   🔢 Tokens:    23 in / 791 out / 814 total
   💰 Costo:     $0.003978

🤖 Claude Sonnet 4.6 (balanced)
   ⏱️  Latencia:  22,057.6 ms
   🔢 Tokens:    23 in / 950 out / 973 total
   💰 Costo:     $0.014319

🤖 Claude Opus 4.6 (powerful)
   ⏱️  Latencia:  21,979.2 ms
   🔢 Tokens:    23 in / 1024 out / 1047 total
   💰 Costo:     $0.025715

────────────────────────────────────────────────────────────
📊 RESUMEN
────────────────────────────────────────────────────────────
   🏆 Más rápido:  Claude Haiku 4.5 (6,967.7 ms)
   💸 Más barato:  Claude Haiku 4.5 ($0.003978)
   📝 Más extenso: Claude Opus 4.6
   💰 Costo total: $0.044012
   📉 Ahorro Haiku vs Opus: 84.5%
════════════════════════════════════════════════════════════

Tabla comparativa:

Modelo	Latencia	Tokens	Costo	vs Haiku
Haiku 4.5	7.0s	814	$0.003978	baseline
Sonnet 4.6	22.1s	973	$0.014319	3.6x más caro
Opus 4.6	22.0s	1047	$0.025715	6.5x más caro

Lo sorprendente

✅ Haiku generó una respuesta completa:

Guía estructurada con Markdown
Tabla de ventajas/desventajas
Ejemplos de código Python
Casos de uso y anti-patrones

❌ Opus NO justificó 6.5x el precio para este contenido.

🤔 Sonnet: Similar latencia a Opus, pero 3.6x más caro que Haiku. ¿Vale la pena?

Comparación de calidad

Extracto de Haiku:

# AWS Lambda: Guía Completa

## ¿Qué es AWS Lambda?

AWS Lambda es un servicio de **computación sin servidor (serverless)** que te permite ejecutar código sin provisionar ni administrar servidores. Solo pagas por el tiempo de ejecución real de tu código.

### Características principales:

- ⚡ Ejecución automática y escalable
- 💰 Pago por uso (duración + memoria)
- 🔄 Se ejecuta en respuesta a eventos
- 📦 Soporta múltiples lenguajes (Python, Node.js, Java, Go, C#, etc.)
- 🚀 Sin mantenimiento de infraestructura

Extracto de Sonnet:

# AWS Lambda

## ¿Qué es?

AWS Lambda es un servicio de **computación sin servidor** (*serverless*) que ejecuta código en respuesta a eventos, sin necesidad de aprovisionar ni administrar servidores.

Tu código → Evento lo dispara → Lambda ejecuta → Pagas solo por lo que usas

Extracto de Opus:

# AWS Lambda

## ¿Qué es?

**AWS Lambda** es un servicio de computación **serverless** (sin servidor) de Amazon Web Services que permite ejecutar código **sin aprovisionar ni administrar servidores**. Solo pagas por el tiempo de cómputo que consumes.

---

## ¿Cómo funciona?

Evento (trigger) → Lambda ejecuta tu función → Devuelve resultado

1. **Subes tu código** (Python, Node.js, Java, Go, C#, Ruby, etc.)
2. **Defines un trigger** (evento que dispara la función)
3. **Lambda se encarga del resto**: escalado, infraestructura, disponibilidad

Conclusión: Los tres modelos explican el concepto correctamente con estructura similar. Las diferencias en formato y énfasis no justifican 6.5x el costo para este tipo de tarea.

¿Cuándo usar cada modelo?

Haiku 4.5 → 80% de casos de uso

Chatbots
Clasificación de texto
Resúmenes
Traducciones
Generación de contenido educativo

Sonnet 4.6 → Equilibrio

Tareas que requieren mejor razonamiento
Cuando Haiku no es suficiente pero Opus es overkill

Opus 4.6 → Solo cuando sea crítico

Análisis legal o médico
Razonamiento complejo
Código de producción crítico
Prompts muy ambiguos

Cómo replicarlo

Repo: GitHub

Clona el repo
Abre guia_setup_aws.py
Sigue los 5 pasos (~15 min)
Prueba con tus propios prompts

Archivos:

bedrock-comparison/
├── lambda_handler.py       # Código de la Lambda
├── guia_setup_aws.py       # Setup paso a paso
└── README.md

Configuración Lambda:

Runtime: Python 3.14
Timeout: 1 min 30 seg
Memory: 128 MB

Costos:

Lambda: $0.00 (free tier)
Bedrock: ~$0.04 por comparación
Para gastar $1: necesitas ~33 invocaciones

Conclusión

Para la mayoría de aplicaciones, Haiku 4.5 es imbatible en calidad/precio.

Solo escala a Sonnet/Opus si tests A/B demuestran que la calidad extra justifica el costo.

💬 ¿Qué modelo usas tú? ¿Has notado diferencias de calidad que justifiquen el costo?

📦 GitHub Repo | 📝 Artículo anterior: Precios de Bedrock

DEV Community