TL;DR
Lambda serverless que compara Claude Haiku 4.5 vs Sonnet 4.6 vs Opus 4.6 en AWS Bedrock.
Mide latencia, tokens y costo real en USD.
Resultado: Haiku es 84.5% más barato que Opus para tareas estándar.
📦 GitHub Repo | 💰 Costo por comparación: $0.044
Contexto
La semana pasada escribí sobre Precios de Bedrock: Lo que realmente vas a pagar.
Hoy los pongo a prueba con código real.
Arquitectura:
Test Event → Lambda (Python 3.14) → Bedrock Runtime
├─ Haiku 4.5
├─ Sonnet 4.6
└─ Opus 4.6
↓
CloudWatch Logs (reporte)
Setup: 100% desde AWS Console (sin IaC).
Tiempo: ~15 min.
Recordatorio rápido: Lambda es el servicio serverless de AWS que ejecuta código sin gestionar servidores. CloudWatch Logs es donde Lambda registra toda su actividad (errores, prints, métricas).
Los resultados
Prompt: "¿Qué es AWS Lambda y cuándo usarlo?"
CloudWatch Logs:
════════════════════════════════════════════════════════════
🔬 BEDROCK MODEL COMPARISON — RESULTADOS
════════════════════════════════════════════════════════════
📝 Prompt: ¿Qué es AWS Lambda y cuándo usarlo?
────────────────────────────────────────────────────────────
🤖 Claude Haiku 4.5 (fast)
⏱️ Latencia: 6,967.7 ms
🔢 Tokens: 23 in / 791 out / 814 total
💰 Costo: $0.003978
🤖 Claude Sonnet 4.6 (balanced)
⏱️ Latencia: 22,057.6 ms
🔢 Tokens: 23 in / 950 out / 973 total
💰 Costo: $0.014319
🤖 Claude Opus 4.6 (powerful)
⏱️ Latencia: 21,979.2 ms
🔢 Tokens: 23 in / 1024 out / 1047 total
💰 Costo: $0.025715
────────────────────────────────────────────────────────────
📊 RESUMEN
────────────────────────────────────────────────────────────
🏆 Más rápido: Claude Haiku 4.5 (6,967.7 ms)
💸 Más barato: Claude Haiku 4.5 ($0.003978)
📝 Más extenso: Claude Opus 4.6
💰 Costo total: $0.044012
📉 Ahorro Haiku vs Opus: 84.5%
════════════════════════════════════════════════════════════
Tabla comparativa:
| Modelo | Latencia | Tokens | Costo | vs Haiku |
|---|---|---|---|---|
| Haiku 4.5 | 7.0s | 814 | $0.003978 | baseline |
| Sonnet 4.6 | 22.1s | 973 | $0.014319 | 3.6x más caro |
| Opus 4.6 | 22.0s | 1047 | $0.025715 | 6.5x más caro |
Lo sorprendente
✅ Haiku generó una respuesta completa:
- Guía estructurada con Markdown
- Tabla de ventajas/desventajas
- Ejemplos de código Python
- Casos de uso y anti-patrones
❌ Opus NO justificó 6.5x el precio para este contenido.
🤔 Sonnet: Similar latencia a Opus, pero 3.6x más caro que Haiku. ¿Vale la pena?
Comparación de calidad
Extracto de Haiku:
# AWS Lambda: Guía Completa
## ¿Qué es AWS Lambda?
AWS Lambda es un servicio de **computación sin servidor (serverless)** que te permite ejecutar código sin provisionar ni administrar servidores. Solo pagas por el tiempo de ejecución real de tu código.
### Características principales:
- ⚡ Ejecución automática y escalable
- 💰 Pago por uso (duración + memoria)
- 🔄 Se ejecuta en respuesta a eventos
- 📦 Soporta múltiples lenguajes (Python, Node.js, Java, Go, C#, etc.)
- 🚀 Sin mantenimiento de infraestructura
Extracto de Sonnet:
# AWS Lambda
## ¿Qué es?
AWS Lambda es un servicio de **computación sin servidor** (*serverless*) que ejecuta código en respuesta a eventos, sin necesidad de aprovisionar ni administrar servidores.
Tu código → Evento lo dispara → Lambda ejecuta → Pagas solo por lo que usas
Extracto de Opus:
# AWS Lambda
## ¿Qué es?
**AWS Lambda** es un servicio de computación **serverless** (sin servidor) de Amazon Web Services que permite ejecutar código **sin aprovisionar ni administrar servidores**. Solo pagas por el tiempo de cómputo que consumes.
---
## ¿Cómo funciona?
Evento (trigger) → Lambda ejecuta tu función → Devuelve resultado
1. **Subes tu código** (Python, Node.js, Java, Go, C#, Ruby, etc.)
2. **Defines un trigger** (evento que dispara la función)
3. **Lambda se encarga del resto**: escalado, infraestructura, disponibilidad
Conclusión: Los tres modelos explican el concepto correctamente con estructura similar. Las diferencias en formato y énfasis no justifican 6.5x el costo para este tipo de tarea.
¿Cuándo usar cada modelo?
Haiku 4.5 → 80% de casos de uso
- Chatbots
- Clasificación de texto
- Resúmenes
- Traducciones
- Generación de contenido educativo
Sonnet 4.6 → Equilibrio
- Tareas que requieren mejor razonamiento
- Cuando Haiku no es suficiente pero Opus es overkill
Opus 4.6 → Solo cuando sea crítico
- Análisis legal o médico
- Razonamiento complejo
- Código de producción crítico
- Prompts muy ambiguos
Cómo replicarlo
Repo: GitHub
- Clona el repo
- Abre
guia_setup_aws.py - Sigue los 5 pasos (~15 min)
- Prueba con tus propios prompts
Archivos:
bedrock-comparison/
├── lambda_handler.py # Código de la Lambda
├── guia_setup_aws.py # Setup paso a paso
└── README.md
Configuración Lambda:
- Runtime: Python 3.14
- Timeout: 1 min 30 seg
- Memory: 128 MB
Costos:
- Lambda: $0.00 (free tier)
- Bedrock: ~$0.04 por comparación
- Para gastar $1: necesitas ~33 invocaciones
Conclusión
Para la mayoría de aplicaciones, Haiku 4.5 es imbatible en calidad/precio.
Solo escala a Sonnet/Opus si tests A/B demuestran que la calidad extra justifica el costo.
💬 ¿Qué modelo usas tú? ¿Has notado diferencias de calidad que justifiquen el costo?
Top comments (0)