Todos amamos nuestro IDE vitaminado con IA (hola, Cursor / Copilot). Son asistentes geniales cuando estamos haciendo pair-programming, pero son reactivos. Cuando cerramos la laptop, desaparecen. Y es justo ahí cuando la deuda técnica, el código espagueti y los imports huérfanos hacen fiesta.
Hoy quiero compartirles un experimento arquitectónico en el que hemos estado trabajando. Lo que empezó como un montón de herramientas CLI aisladas para mi uso personal, evolucionó a un Orquestador de Agentes Autónomos que llamamos SKRYMIR.
🔥 El problema de la IA Reactiva vs Proactiva Las IAs tradicionales te ayudan a escribir nuevo código. Cerebro está diseñado como un SRE de código puro: monitorea la salud del repositorio, detecta degradación en la complejidad ciclomática, e inyecta curas preventivas en la madrugada (lo que llamamos "Modo Nocturno").
🛠️ La Anatomía de nuestro Pipeline: El "Tribunal Multi-Agente" Actualmente nos encontramos realizando pruebas pesadas, afinando el flujo asíncrono y recolectando aprendizajes sobre cuánto nivel de autonomía puede manejar el sistema.
El flujo que terminamos validando es un ciclo cerrado de CI/CD impulsado por agentes puros. Desde nuestro panel de control dicto un prompt general: "Integra la validación por horarios".
Aquí va nuestro pipeline interno paso a paso:
La Codificación: Se dispara Aider en una rama asolada (git checkout -b skrymir-feature/). Analiza el repo y programa el requerimiento.
**El Validation Gate: El Executor toma el relevo. Antes de cualquier cosa, hace validaciones locales crudas (como npm run build o correr compiladores de Cargo si es Rust). Si la IA rompió la compilación, se rechaza la rama de inmediato.
Smart Merge: Si todo es verde (Exit Code 0), Cerebro toma control, vuelve a main y realiza el auto-merge de la nueva feature de manera procedimental.
**El Tribunal *(Aquí está la magia): Inmediatamente después del merge, se gatilla una validación en cadena donde 3 Agentes auditan exclusivamente el archivo editado:
Sentinel: Escanea código muerto e imports huérfanos estáticamente (vía su Core en Rust).
Architect: Evalúa que no se hayan violado contratos ni patrones de diseño globales.
Warden: Realiza pasadas preventivas de inyección y vulnerabilidades.
💡 Siguientes Pasos y Aprendizajes Nuestras validaciones de los últimos días nos enseñaron algo vital: la seguridad inicial. Para escalar esto y ganar la confianza de un equipo completo, estamos puliendo el "Modo Aprendiz", donde Cerebro simplemente emite Pull Requests con sugerencias de fixes en lugar de empujarlos en crudo a main, ganando la confianza del desarrollador gradualmente.
Construir herramientas para construir herramientas es otro nivel de diversión. ¿Alguno de ustedes ha experimentado anidando flujos entre distintos agentes de IA locales? ¡Dejen sus aportes en los comentarios!

Top comments (0)