🇬🇧 Read the English version here
El Problema: La erosión de la Soberanía Tecnológica
Como ingenieros, hemos caído en una trampa de conveniencia. Estamos construyendo sobre "arenas movedizas": APIs cerradas, cajas negras y una dependencia total de la nube. Cada vez que enviamos un prompt, regalamos contexto y perdemos soberanía.
Decidí que no quería un "asistente" que me contara chistes. Quería una infraestructura de mando. Así nació Fararoni, un ecosistema diseñado para tratar a la IA como lo que debería ser: infraestructura ejecutable, no solo una interfaz de chat.
1. La Visión del Centurión: Arquitectura de Mando
En Fararoni, nos alejamos del modelo de "copiloto" para adoptar la Visión del Centurión.
- El Humano es el Arquitecto: Define la estrategia, los límites y el objetivo de la misión.
- La IA es el Centurión: Orquesta y ejecuta.
Para lograr esto, la arquitectura no puede ser lineal. Necesitamos una infraestructura que soporte fallos, latencia y cambios de contexto en tiempo real.
2. El Stack Técnico: ¿Por qué Java 25 y NATS?
Java 25 y el poder de los Virtual Threads
Muchos se preguntan: ¿Por qué no Python? La respuesta es simple: concurrencia y robustez.
Al usar Java 25, aprovechamos los hilos virtuales (Project Loom) para manejar cientos de agentes y procesos del "Enjambre" (Swarm) de manera ligera. Con el soporte de GraalVM, logramos binarios nativos que arrancan en milisegundos, ideales para una CLI que debe sentirse instantánea.
NATS: El Sistema Nervioso
No usamos una API REST interna para la comunicación de módulos. Usamos NATS como bus de eventos. Esto nos permite:
- Desacoplamiento total: Los "Sidecars" (WhatsApp, Telegram, Terminal) no saben quién procesa la orden, solo escuchan el bus.
- Resiliencia: Si un modelo local se cae, el mensaje permanece en el bus hasta que un trabajador (worker) esté listo.
3. Innovación Táctica: DAGs y Hot-Swapping
Trazabilidad mediante DAGs (Directed Acyclic Graphs)
La IA suele ser una caja negra. En Fararoni, cada decisión de la IA se mapea en un DAG. Esto permite que el arquitecto humano audite el flujo:
- ¿De dónde vino esta información?
- ¿Qué modelo tomó la decisión?
- ¿Cuál fue el costo y la latencia? Si no es auditable, no es profesional.
Hot-Swap de Modelos: El puente entre lo Local y la Nube
Uno de los mayores retos fue el Cambio en Caliente.
- Para tareas de baja sensibilidad o pre-procesamiento, usamos un modelo local de 1.5B parámetros.
- Si la tarea escala en complejidad, el sistema hace un "Hot-Swap" a Claude 3.5 o GPT-4 sin perder el estado de la misión. Tú mantienes el control de qué datos salen de tu infraestructura y cuáles no.
4. Patrimonio Digital y Open Source
He liberado el núcleo de comunicación y los plugins bajo la licencia Apache 2.0. No busco crear otra plataforma cautiva; busco ayudar a otros ingenieros en Latinoamérica y el mundo a construir su propio Patrimonio Digital.
La soberanía no es solo una palabra bonita; es tener los binarios, el bus de datos y los modelos bajo tu propio mando.
Conclusión: El Enjambre está creciendo
Fararoni ya es real. Los instaladores están disponibles y la terminal ya orquesta misiones.
No es un producto terminado, es un ecosistema vivo.
¿Qué opinan sobre el uso de NATS para orquestación de LLMs en comparación con arquitecturas tradicionales basadas en colas como RabbitMQ o Kafka? Los leo en los comentarios.
Explora el código y la documentación en: fararoni.dev
*Tags: #OpenSource #Java25 #GraalVM #Java #ProjectLoom #CloudNativeJava #SelfHosted #NATS #SoftwareArchitecture #SovereignAI #SoftwareArchitecture #Fararoni #AI #TechSovereignty #Ollama #DeepSeek #Qwen #LocalLLM #AIInfrastructure
Top comments (0)