DEV Community

Cover image for Comando /goal: Cómo Ejecutar Código de Codex y Claude como Agentes Autónomos 24/7
Roobia
Roobia

Posted on • Originally published at apidog.com

Comando /goal: Cómo Ejecutar Código de Codex y Claude como Agentes Autónomos 24/7

Cada laboratorio de IA importante lanzó la misma primitiva en las últimas seis semanas. Anthropic añadió /goal a Claude Code. OpenAI lo implementó dentro de Codex CLI y la aplicación de escritorio de Codex. Nous Research lo integró en Hermes. El nombre es consistente a propósito: la industria está convergiendo en una interfaz compartida para agentes que trabajan en bucle cerrado hasta alcanzar un estado final medible, sin pedir aprobación en cada paso.

Prueba Apidog hoy

Si todavía haces el ciclo manual de “aprobar, enviar un prompt, decirle al agente que continúe, repetir”, /goal es el comando de barra que lo elimina. Defines un objetivo, el agente trabaja hasta cumplirlo y vuelve cuando tiene un resultado verificable.

Esta guía está orientada a desarrolladores y equipos de API. Verás qué hace /goal por debajo, cómo configurarlo en Codex y Claude Code, cómo escribir prompts que no terminen en bucles infinitos y cómo conectarlo a un flujo de trabajo de API con Apidog.

Descarga Apidog gratis si quieres seguir los ejemplos de API más adelante.

Qué hace realmente /goal

En una línea: /goal permite que un agente de IA ejecute una tarea en bucle hasta que se cumpla una condición de parada, sin requerir aprobación humana en cada iteración.

El mecanismo es directo:

  1. El agente principal planifica y ejecuta un paso.
  2. Un modelo validador pequeño y rápido revisa el resultado.
  3. El validador responde: “¿el objetivo ya se cumplió?”.
  4. Si la respuesta es no, el agente sigue.
  5. Si la respuesta es sí, el bucle termina y el agente informa.

Es el mismo patrón que popularizó el “bucle Ralph” a principios de 2026, pero ahora empaquetado como comando de primera clase dentro de herramientas oficiales.

Comparación práctica:

  • Sin /goal: tú eres el bucle. Lees la salida, decides si es correcta, indicas el siguiente paso, apruebas herramientas y repites.
  • Con /goal: el agente posee el bucle. Planifica, ejecuta, se autovalida y vuelve cuando termina, alcanza una restricción o agota presupuesto.

Ejemplo:

/goal create a landing page
Enter fullscreen mode Exit fullscreen mode

En Claude Code, esto puede activar investigación, scaffolding, estilos, depuración y vista previa final en una sola ejecución continua.

Por qué /goal está apareciendo en todas partes

Las tareas largas con agentes fallaban de dos formas predecibles:

  1. Deriva: sin un validador que compare contra el objetivo original, el modelo producía una salida segura pero incorrecta.
  2. Supervisión constante: incluso cuando el modelo podía hacer el trabajo, el usuario tenía que vigilar cada iteración.

Un segundo modelo validador reduce ambos problemas. Es barato, rápido y le da al bucle una condición de parada clara. Ese es el patrón que los proveedores están estandarizando.

Configurar /goal en Codex

Codex CLI ofrece el mayor control. Configuración mínima:

  1. Habilita objetivos en la aplicación de escritorio Abre Codex Desktop, ve a Configuración → Configuración y establece:
   goals = true
Enter fullscreen mode Exit fullscreen mode

El CLI hereda esta configuración.

  1. Inicia el CLI en modo automático
   codex --approval-mode full-auto
Enter fullscreen mode Exit fullscreen mode
  1. Define un objetivo
   /goal [tu objetivo aquí]
Enter fullscreen mode Exit fullscreen mode

Codex confirmará que el objetivo quedó registrado y empezará a ejecutarlo.

Captura de pantalla de la terminal de Codex que muestra la configuración de /goal

Si no quieres trabajar desde terminal, empieza con la aplicación de escritorio de Codex. La funcionalidad es la misma, pero tienes controles visuales para pausar, borrar y observar el uso de tokens.

Configurar /goal en Claude Code

Claude Code funciona de forma similar:

  1. Abre Claude Code CLI.
  2. Escribe /goal.
  3. Añade la descripción de la tarea.

Ejemplo:

/goal arreglar las pruebas fallidas hasta que npm test termine con código 0
Enter fullscreen mode Exit fullscreen mode

La documentación oficial está en el sitio de documentación de Claude Code.

Captura de pantalla de la terminal de Claude Code mostrando la configuración de /goal

Si encuentras errores de configuración al iniciar Claude Code, la solución para la configuración de empresa custom3p inválida cubre el fallo más común. Para flujos multiagente con Claude Code y /goal, revisa el análisis de Ruflo, una capa multiagente sobre Claude Code.

Consejo práctico: en Claude Code, /goal muestra tokens en vivo y una barra de progreso. Vigila los tokens, no solo la salida. Si el agente consume tokens sin progreso visible, el validador probablemente no está convergiendo. Usa:

/pause
Enter fullscreen mode Exit fullscreen mode

o:

/goal clear
Enter fullscreen mode Exit fullscreen mode

La estructura de prompt que funciona

La sintaxis de /goal es simple. Lo difícil es escribir un objetivo que produzca una salida usable.

Un buen prompt de /goal tiene tres partes:

  1. Trabajo: qué quieres que haga.
  2. Estado final medible: cómo se verifica que está terminado.
  3. Restricciones: qué no debe romper ni modificar.

Plantilla base:

/goal [haz el trabajo] hasta [estado final medible] sin [restricciones que deben mantenerse]
Enter fullscreen mode Exit fullscreen mode

Ejemplo para código:

/goal arreglar cada prueba fallida hasta que npm test salga con 0 sin modificar ningún archivo fuera del directorio /auth
Enter fullscreen mode Exit fullscreen mode

Por qué funciona:

  • npm test devuelve una señal verificable.
  • El código de salida 0 define el estado final.
  • /auth limita el área de modificación.
  • El validador puede comprobar la restricción en cada iteración.

Evita objetivos ambiguos como:

/goal haz que esta UI se sienta moderna
Enter fullscreen mode Exit fullscreen mode

Mejor:

/goal mejorar la UI hasta que Lighthouse marque accesibilidad 90+ sin cambiar la estructura de rutas existente
Enter fullscreen mode Exit fullscreen mode

Estructura avanzada para tareas largas

Para objetivos más grandes, usa bloques explícitos:

/goal
Objetivo: [objetivo de una línea]

Criterios de éxito:
  - [criterio medible 1]
  - [criterio medible 2]

Restricciones:
  - [límite 1]
  - [límite 2]

Contexto:
  - [archivos, repositorios o claves que el agente debe conocer]
Enter fullscreen mode Exit fullscreen mode

Ejemplo:

/goal
Objetivo: implementar el endpoint POST /auth/login

Criterios de éxito:
  - npm test termina con código 0
  - las pruebas de contrato para POST /auth/login pasan
  - la respuesta de éxito incluye accessToken y refreshToken

Restricciones:
  - no modificar archivos fuera de /auth y /tests/auth
  - no cambiar el esquema público existente
  - no registrar tokens en logs

Contexto:
  - usar openapi.yaml como contrato
  - revisar src/auth
  - ejecutar npm test antes de finalizar
Enter fullscreen mode Exit fullscreen mode

Este formato le da al validador señales concretas. Sin criterios medibles, el validador depende de coincidencia semántica difusa, que es donde aparece la deriva.

Ejemplos útiles para copiar

Investigación

/goal recopilar todos los benchmarks públicos para Claude Opus 4.7 publicados desde abril de 2026, guardar las fuentes y producir una tabla Markdown ordenada por fecha hasta que la tabla cubra al menos 10 benchmarks distintos
Enter fullscreen mode Exit fullscreen mode

Mantenimiento de repositorio

/goal encontrar código muerto, dependencias no utilizadas y archivos obsoletos en este repositorio, luego proponer una descripción de PR listando eliminaciones seguras hasta que cada elemento tenga una justificación
Enter fullscreen mode Exit fullscreen mode

Documentación

/goal reescribir README.md para que un nuevo colaborador pueda instalar, ejecutar, probar y entender el proyecto hasta que cada uno de esos cuatro pasos tenga un comando que funcione y una salida esperada
Enter fullscreen mode Exit fullscreen mode

Desarrollo de features

/goal añadir un alternador de tema oscuro/claro, persistir la elección en localStorage, actualizar los estilos para ambos temas y verificar en el navegador hasta que el alternador funcione sin recargar la página y sobreviva a una actualización
Enter fullscreen mode Exit fullscreen mode

El patrón común: cada ejemplo define una condición verificable. Esa es la diferencia entre un objetivo que termina y uno que gira indefinidamente.

Combinar /goal con desarrollo de API

El caso más útil para backend y platform engineers está en APIs, porque el estado final suele ser verificable:

  • la request devuelve 200;
  • el esquema de respuesta coincide;
  • los casos de prueba pasan;
  • el contrato está documentado.

Flujo recomendado:

  1. Diseña el contrato primero en Apidog

    Define endpoint, esquema de request, esquema de response y payloads de ejemplo dentro de Apidog. Ese contrato será la fuente de verdad.

  2. Exporta la especificación

    Apidog exporta OpenAPI 3.x. Entrega ese archivo a Codex o Claude Code como contexto.

  3. Ejecuta /goal

    Usa un objetivo con estado final claro:

   /goal implementar POST /users hasta que todos los casos de prueba de Apidog pasen sin cambiar el contrato OpenAPI
Enter fullscreen mode Exit fullscreen mode
  1. Haz que el validador ejecute pruebas En cada iteración, el validador ejecuta las pruebas contra el servicio. El agente solo finaliza cuando todo está en verde.

Este flujo es mejor que dejar que el agente invente sus propias pruebas. El contrato ya existe, así que el agente no puede “resolver” el problema omitiendo casos extremos.

Si no has usado Apidog antes, la plataforma combina diseño, mocking, pruebas y documentación de APIs. Esto importa porque /goal funciona mejor cuando el validador solo necesita ejecutar un comando para verificar el estado. La guía de flujo de trabajo de API de diseño primero cubre la configuración contrato-first, y la descripción general de la herramienta de prueba de API para ingenieros de control de calidad muestra cómo estructurar casos de prueba.

Si trabajas con servidores MCP, el mismo patrón aplica. Revisa pruebas de servidor MCP con Apidog para configurar ejecuciones seguras contra tu servidor MCP local.

Consejos para usar /goal en producción

  • Un objetivo a la vez Codex y Claude Code restringen a un objetivo activo. Limpia el anterior antes de iniciar otro:
  /goal clear
Enter fullscreen mode Exit fullscreen mode
  • Usa /plan antes de /goal

    Primero pide un plan, revísalo y luego ejecútalo como objetivo. Reduce iteraciones porque el agente no rediseña el enfoque a mitad del bucle.

  • Mantén un archivo de progreso

    Pide al agente que actualice progress.md. Obtendrás un rastro de auditoría y el agente tendrá contexto persistente.

  • Haz que el modelo escriba el objetivo

    Describe tu intención en lenguaje natural y pide al modelo que la convierta en un /goal con criterios medibles.

  • Observa el validador

    Si el bucle no termina, el problema suele estar en criterios de éxito vagos. Ajusta el objetivo en lugar de repetirlo.

  • No uses /goal para tareas triviales

    Para un cambio de una línea, un prompt normal suele ser más rápido. El bucle autónomo tiene overhead.

Cuándo /goal fallará

Ten en cuenta estas limitaciones:

  • Costo

    Un bucle de una hora consumirá más tokens que una sesión manual. Establece presupuesto y pausa cuando sea necesario.

  • Tareas sin señal clara

    Pulido visual, tono de prosa o gusto de diseño no tienen validadores fuertes. Define métricas o usa prompts normales.

  • Efectos secundarios externos

    Objetivos que envían correos, ejecutan pagos o llaman APIs de producción necesitan restricciones estrictas. El agente no inferirá cautela por sí solo. Si estás construyendo control de acceso para agentes que llaman APIs, el artículo sobre uso de GitHub Copilot y la API de facturación para equipos cubre cómo lo manejan algunos proveedores.

  • Contexto obsoleto

    Si el código base cambia durante una ejecución larga, pausa y reinicia. No dejes que el agente continúe con contexto viejo.

Qué significa para construir con IA

/goal cambia el flujo de “IA como autocompletado” a “IA como trabajador supervisado”. El comando es pequeño, pero el cambio de trabajo es grande: como desarrollador, inviertes más tiempo escribiendo criterios de éxito y restricciones, y menos tiempo escribiendo cada línea.

Los equipos que más se benefician son los que ya tienen:

  • contratos verificables;
  • CI estable;
  • pruebas automatizadas;
  • especificaciones claras;
  • documentación actualizada.

Si tu API tiene OpenAPI y pruebas, puedes dar al agente un endpoint y un estado final. Si la API solo existe en la cabeza de alguien, el agente no tiene nada contra lo que validar.

Aquí las plataformas de API se vuelven infraestructura clave para flujos de IA. Apidog está construido alrededor del desarrollo de API con enfoque design-first, lo que encaja bien cuando el agente puede leer una especificación y verificar su trabajo contra casos de prueba. Descarga Apidog si quieres configurar el flujo contrato-first descrito arriba.

Preguntas frecuentes

¿Funciona /goal en la aplicación web de Codex?

Sí. Funciona en Codex CLI, Codex Desktop, la aplicación Codex y Claude Code CLI. Hermes también soporta el mismo comando.

¿En qué se diferencia /goal de un prompt regular?

Un prompt regular se ejecuta una vez y se detiene. /goal se ejecuta en bucle cerrado con un modelo validador que comprueba la condición de parada después de cada paso.

¿Puede el agente romper mis restricciones?

El validador revisa las restricciones en cada iteración, pero la precisión depende de cómo las escribas. “Sin modificar archivos fuera de /auth” es verificable. “Sin romper nada” no lo es.

¿/goal cuesta más que una sesión normal de Claude o Codex?

Sí. El validador suele ser un modelo más pequeño y barato, pero el modelo principal sigue trabajando durante más iteraciones. Usa presupuesto, límites y /pause.

¿Qué pasa si quiero probar la salida contra una API real?

Usa una herramienta como Apidog para fijar el contrato y ejecutar casos de prueba reales contra la implementación. El validador puede usar esos resultados como estado final medible. Si estás iniciando un servicio basado en Claude con presupuesto limitado, consulta la guía gratuita de API de Claude.

Top comments (0)