Cursor lanzó Composer 2.5 el 18 de mayo de 2026. El punto clave para desarrolladores: un modelo de codificación que se acerca a Opus 4.7 y GPT-5.5 en benchmarks de software reales, con un costo inferior a un dólar por tarea. Si usas agentes para implementar features, corregir bugs o generar código API, esta relación precio-calidad cambia cómo conviene estructurar el trabajo diario.
Esta guía explica qué es Composer 2.5, cómo activarlo en Cursor y cómo usarlo en tareas de producción. También incluye benchmarks, precios y un flujo práctico para combinarlo con Apidog cuando el código generado toca APIs.
¿Qué es Cursor Composer 2.5?
Composer 2.5 es el modelo de codificación agentic propio de Cursor. Está diseñado para trabajar dentro del editor: planifica tareas, edita archivos, ejecuta comandos de terminal y verifica su propio resultado. Es el sucesor de Composer 2, pero apunta a tareas más largas y menos fragmentadas.
Datos relevantes:
- Está construido sobre el checkpoint open source Moonshot Kimi K2.5, una base de aproximadamente un billón de parámetros.
- Cursor dedicó cerca del 85% del presupuesto de cómputo de entrenamiento al post-entrenamiento y aprendizaje por refuerzo.
- Se entrenó con 25 veces más tareas sintéticas que Composer 2.
- Parte del entrenamiento incluyó ejercicios donde Cursor elimina una funcionalidad y el modelo debe reconstruirla hasta que las pruebas pasen.
En la práctica, Composer 2.5 está pensado para mantener contexto durante sesiones largas. Composer 2 era rápido, pero podía desviarse en tareas de varios pasos. Composer 2.5 mejora especialmente cuando el trabajo requiere leer varios archivos, editar más de un módulo y validar con tests.
Si quieres entender la base sobre la que se construye, revisa la guía de Composer 2.
Qué cambió bajo el capó
El salto viene de tres decisiones de entrenamiento:
RL dirigido con retroalimentación textual
En lugar de usar solo una recompensa final, Cursor genera una pista textual corta con la corrección esperada, la inserta en el contexto local y destila ese comportamiento de vuelta al modelo. Esto ayuda a que el modelo evite llamadas a herramientas no disponibles.Más datos sintéticos verificados
El aumento de 25 veces en tareas sintéticas le da más práctica sobre repositorios realistas. La validación no depende solo de intuición: las tareas se verifican con pruebas.Optimizador Muon fragmentado con HSDP de doble malla
Es infraestructura de entrenamiento, no una función que configures en Cursor. Pero permitió entrenar un modelo de 1 billón de parámetros con un paso de optimizador de 0.2 segundos, acelerando las iteraciones de calidad.
Como usuario, no necesitas configurar nada de esto. Lo importante es el efecto: más estabilidad en tareas largas y complejas.
Benchmarks de Composer 2.5
Cursor reporta los siguientes resultados frente a Opus 4.7 y GPT-5.5:
| Benchmark | Composer 2.5 | Opus 4.7 | GPT-5.5 |
|---|---|---|---|
| SWE-bench Multilingüe | 79.8% | 80.5% | 77.8% |
| Terminal-Bench 2.0 | 69.3% | 69.4% | 82.7% |
| CursorBench v3.1 | 63.2% | 64.8% máx. / 61.6% predeterminado | 59.2% predeterminado |
En SWE-bench Multilingüe, Composer 2.5 obtiene 79.8%, cerca de Opus 4.7 y por encima de GPT-5.5. También mejora frente al 73.7% de Composer 2.
En CursorBench, supera la configuración predeterminada de Opus 4.7. Donde queda más atrás es en Terminal-Bench 2.0, donde GPT-5.5 lidera con 82.7%. Si tu flujo depende mucho de secuencias largas de terminal, conviene tenerlo en cuenta.
El diferencial más importante es el costo. Cursor reporta aproximadamente 63% en CursorBench con un costo promedio inferior a $1 por tarea. Opus 4.7 y GPT-5.5 cuestan varios dólares por tarea para resultados similares o inferiores; algunas comparaciones elevan los costos de competidores hasta unos once dólares. La cobertura de The Decoder llegó a una conclusión similar: calidad cercana al estado del arte por una fracción del precio.
La lectura práctica: Composer 2.5 no lidera todos los benchmarks, pero ofrece una compensación atractiva para uso diario: calidad alta con costo bajo por tarea.
¿Cuánto cuesta Composer 2.5?
Cursor ofrece dos variantes:
| Variante | Entrada | Salida | Cuándo usarla |
|---|---|---|---|
| Estándar | $0.50 / M tokens | $2.50 / M tokens | Tareas de agente donde importa optimizar costo |
| Rápida | $3.00 / M tokens | $15.00 / M tokens | Iteración en vivo o tareas sensibles a latencia |
La variante rápida mantiene la misma inteligencia del modelo, pero reduce la espera. Es la predeterminada en el producto.
La facturación depende del plan:
- Planes individuales: incluyen un fondo de uso de Composer independiente. En uso diario normal, muchos desarrolladores no llegarán al cobro por token.
- Planes de equipo y empresariales: se cobran directamente según la tarifa de API.
- Promoción de lanzamiento: Cursor duplicó el uso de Composer 2.5 durante la primera semana después del lanzamiento.
Para más detalles, consulta la guía de precios de Cursor Composer. Si quieres probarlo sin gastar, el tutorial de Composer gratis explica la ruta de uso incluido.
Cómo acceder a Cursor Composer 2.5
Sigue estos pasos:
Actualiza Cursor
Abre Cursor y busca actualizaciones. En macOS está en el menú de Cursor; en otros sistemas, normalmente en el menú Ayuda. Reinicia si se instala una actualización.Inicia sesión con un plan compatible
Los planes Pro y Business incluyen uso de Composer. Una cuenta gratuita puede probarlo mediante asignaciones incluidas, pero el uso intensivo requiere plan de pago.Abre el selector de modelos
Inicia un chat o una sesión de agente. Luego abre el desplegable de modelos y selecciona:
composer-2.5
- Usa modo Agente Composer 2.5 está diseñado para trabajo agentic. Usa modo Agente en lugar de chat simple para permitir edición de archivos, terminal y herramientas.
El modelo puede leer y editar archivos, ejecutar comandos y llamar herramientas expuestas por Cursor. Los documentos oficiales de Composer 2.5 mantienen los valores predeterminados actualizados.
Si ya usaste Cursor, pero no su agente, el resumen de Cursor 2.0 sirve como introducción a esa superficie.
Cómo usar Composer 2.5 de forma efectiva
La clave no es solo elegir el modelo, sino darle tareas verificables.
1. Dale tareas completas, no microinstrucciones
Mejor:
Añade paginación al endpoint de pedidos, actualiza los tipos del cliente,
agrega pruebas para límites inválidos y ejecuta la suite relacionada.
Peor:
Edita esta línea.
Composer 2.5 mejora especialmente cuando puede planificar, editar y validar.
2. Define la condición de éxito
Incluye cómo vas a evaluar el resultado:
La tarea está completa cuando:
- todas las pruebas existentes siguen pasando;
- el endpoint devuelve 422 para entradas inválidas;
- la respuesta incluye page, pageSize y total;
- no cambia el contrato actual salvo los nuevos campos documentados.
Esto ayuda al agente a autocorregirse con una meta clara.
3. Pide validación explícita
Ejemplo:
Después de implementar, ejecuta las pruebas relevantes.
Si fallan, analiza el error, corrige el cambio y vuelve a ejecutarlas.
No modifiques archivos no relacionados.
4. Elige bien la variante
- Usa Estándar para trabajo por lotes o tareas largas donde importa el costo.
- Usa Rápida cuando estás iterando en vivo y esperando cada respuesta.
La calidad es la misma; cambia la latencia y el precio.
5. Mantén el contexto real
Los agentes pueden generar código convincente con datos incorrectos. Esto es crítico en APIs: un endpoint inventado o un campo mal nombrado puede compilar, pero fallar en runtime.
Composer 2.5 más tu flujo de trabajo de API
Muchas tareas reales tocan una API: clientes HTTP, endpoints, validaciones, mocks, tests de contrato o documentación. Si le pides a Composer 2.5 que escriba un cliente para un servicio de pagos sin especificación real, puede asumir endpoints, campos o autenticación incorrectos.
Usa este flujo:
Paso 1: conecta la especificación real
Conecta tu especificación API a Cursor mediante el servidor MCP de Apidog. Así Composer 2.5 puede generar código contra tu esquema real, no contra una suposición.
Si usas otros agentes, revisa también la lista de mejores servidores MCP para Cursor.
Paso 2: pide generación basada en contrato
Ejemplo de prompt:
Usa la especificación API disponible por MCP.
Genera un cliente TypeScript para el endpoint de pedidos.
Incluye:
- tipos de request y response;
- manejo de errores 4xx y 5xx;
- prueba para respuesta exitosa;
- prueba para payload inválido.
No inventes campos fuera del esquema.
Paso 3: verifica las llamadas generadas
Toma los endpoints que escribió Composer 2.5 y pruébalos en Apidog:
- Envía solicitudes reales.
- Verifica códigos de estado.
- Confirma la forma de las respuestas.
- Convierte los casos que funcionan en pruebas automatizadas.
- Usa mocks cuando necesites desarrollar sin depender del backend.
El modelo escribe el primer borrador. Apidog confirma que el contrato se cumple.
Composer 2.5 vs. la competencia
Guía rápida para elegir:
- vs Opus 4.7: resultados muy cercanos en SWE-bench Multilingüe y CursorBench, con costo por tarea menor. Opus aún lidera en la configuración máxima absoluta de CursorBench.
- vs GPT-5.5: Composer 2.5 gana en SWE-bench Multilingüe y CursorBench; GPT-5.5 lidera claramente en Terminal-Bench 2.0.
- vs Claude Code: son flujos distintos. Composer 2.5 vive dentro del editor Cursor; Claude Code es un agente de terminal. La comparación entre Claude Code y Cursor explica cuándo usar cada uno.
- vs GitHub Copilot: Copilot es fuerte como completador inline; Composer 2.5 está diseñado para tareas agentic de múltiples archivos. La guía de Cursor vs. GitHub Copilot profundiza en esa diferencia.
Cursor también dijo que está entrenando un modelo mucho más grande con xAI usando aproximadamente diez veces más capacidad de cómputo. Composer 2.5 es un punto de control dentro de esa evolución, no el límite final.
Preguntas frecuentes
¿Composer 2.5 es gratuito?
No hay una capa completamente gratuita. Los planes individuales incluyen un grupo de uso de Composer que cubre trabajo diario normal, y Cursor duplicó el uso durante la semana de lanzamiento. La guía de Composer gratuito explica el alcance de la asignación incluida.
¿Composer 2.5 es mejor que Composer 2?
Sí. SWE-bench Multilingüe subió de 73.7% a 79.8%, y el modelo mantiene mejor el contexto en tareas largas. La guía de Composer 2 sirve como línea base.
¿En qué modelo se basa Composer 2.5?
Está construido sobre el checkpoint open source Kimi K2.5 de Moonshot y luego fue post-entrenado por Cursor con aprendizaje por refuerzo y tareas sintéticas.
¿Qué variante debo elegir?
Usa Estándar si priorizas costo. Usa Rápida si estás iterando en vivo y necesitas menor latencia. La inteligencia del modelo es la misma.
¿Composer 2.5 funciona con especificaciones API y MCP?
Sí. Composer 2.5 funciona con el conjunto de herramientas de agente de Cursor, incluido MCP. Puedes conectar tu especificación mediante el servidor MCP de Apidog para generar código contra tu esquema real.
En resumen
Composer 2.5 muestra que la codificación agentic de alta calidad no tiene por qué costar varios dólares por tarea. Ofrece resultados cercanos a modelos de frontera en tareas reales de software, dentro de Cursor y con un costo promedio inferior a $1 por tarea.
Para usarlo bien:
- Actualiza Cursor.
- Selecciona
composer-2.5. - Trabaja en modo Agente.
- Dale tareas completas con criterios de éxito.
- Ejecuta pruebas y valida los cambios.
- Si hay APIs involucradas, genera contra tu especificación real y verifica las llamadas.
Para cerrar el ciclo, descarga Apidog, envía solicitudes reales, confirma respuestas y convierte los casos válidos en pruebas automatizadas y mocks. Código rápido es útil; código rápido y verificado es mucho mejor.


Top comments (0)