Eber Cruz Fararoni

Posted on Mar 18

Más allá de los Chatbots: Construyendo un Ecosistema de IA Soberana con Java 25 y NATS

#ai #architecture #java #systemdesign

El Problema: La erosión de la Soberanía Tecnológica

Como ingenieros, hemos caído en una trampa de conveniencia. Estamos construyendo sobre "arenas movedizas": APIs cerradas, cajas negras y una dependencia total de la nube. Cada vez que enviamos un prompt, regalamos contexto y perdemos soberanía.

Decidí que no quería un "asistente" que me contara chistes. Quería una infraestructura de mando. Así nació Fararoni, un ecosistema diseñado para tratar a la IA como lo que debería ser: infraestructura ejecutable, no solo una interfaz de chat.

1. La Visión del Centurión: Arquitectura de Mando

En Fararoni, nos alejamos del modelo de "copiloto" para adoptar la Visión del Centurión.

El Humano es el Arquitecto: Define la estrategia, los límites y el objetivo de la misión.
La IA es el Centurión: Orquesta y ejecuta.

Para lograr esto, la arquitectura no puede ser lineal. Necesitamos una infraestructura que soporte fallos, latencia y cambios de contexto en tiempo real.

2. El Stack Técnico: ¿Por qué Java 25 y NATS?

Java 25 y el poder de los Virtual Threads

Muchos se preguntan: ¿Por qué no Python? La respuesta es simple: concurrencia y robustez.
Al usar Java 25, aprovechamos los hilos virtuales (Project Loom) para manejar cientos de agentes y procesos del "Enjambre" (Swarm) de manera ligera. Con el soporte de GraalVM, logramos binarios nativos que arrancan en milisegundos, ideales para una CLI que debe sentirse instantánea.

NATS: El Sistema Nervioso

No usamos una API REST interna para la comunicación de módulos. Usamos NATS como bus de eventos. Esto nos permite:

Desacoplamiento total: Los "Sidecars" (WhatsApp, Telegram, Terminal) no saben quién procesa la orden, solo escuchan el bus.
Resiliencia: Si un modelo local se cae, el mensaje permanece en el bus hasta que un trabajador (worker) esté listo.

3. Innovación Táctica: DAGs y Hot-Swapping

Trazabilidad mediante DAGs (Directed Acyclic Graphs)

La IA suele ser una caja negra. En Fararoni, cada decisión de la IA se mapea en un DAG. Esto permite que el arquitecto humano audite el flujo:

¿De dónde vino esta información?
¿Qué modelo tomó la decisión?
¿Cuál fue el costo y la latencia? Si no es auditable, no es profesional.

Hot-Swap de Modelos: El puente entre lo Local y la Nube

Uno de los mayores retos fue el Cambio en Caliente.

Para tareas de baja sensibilidad o pre-procesamiento, usamos un modelo local de 1.5B parámetros.
Si la tarea escala en complejidad, el sistema hace un "Hot-Swap" a Claude 3.5 o GPT-4 sin perder el estado de la misión. Tú mantienes el control de qué datos salen de tu infraestructura y cuáles no.

4. Patrimonio Digital y Open Source

He liberado el núcleo de comunicación y los plugins bajo la licencia Apache 2.0. No busco crear otra plataforma cautiva; busco ayudar a otros ingenieros en Latinoamérica y el mundo a construir su propio Patrimonio Digital.

La soberanía no es solo una palabra bonita; es tener los binarios, el bus de datos y los modelos bajo tu propio mando.

Conclusión: El Enjambre está creciendo

Fararoni ya es real. Los instaladores están disponibles y la terminal ya orquesta misiones.
No es un producto terminado, es un ecosistema vivo.

¿Qué opinan sobre el uso de NATS para orquestación de LLMs en comparación con arquitecturas tradicionales basadas en colas como RabbitMQ o Kafka? Los leo en los comentarios.

Explora el código y la documentación en: fararoni.dev

*Tags: #OpenSource #Java25 #GraalVM #Java #ProjectLoom #CloudNativeJava #SelfHosted #NATS #SoftwareArchitecture #SovereignAI #SoftwareArchitecture #Fararoni #AI #TechSovereignty #Ollama #DeepSeek #Qwen #LocalLLM #AIInfrastructure

DEV Community