Ramses Mata for AWS

Posted on May 6

¿Qué es un Agente de IA? Explicado para devs

#agents #ai #beginners #spanish

Si has usado un chat de IA, ya interactuaste con un modelo. Le haces una pregunta, te responde, y ahí termina la historia. Pero, ¿qué pasa cuando necesitas que la IA no solo responda, sino que haga cosas? Que busque información, ejecute código, llame APIs, y tome decisiones sobre qué hacer a continuación. Ahí es donde entran los agentes de IA.

En mi artículo anterior exploramos qué es un modelo de IA, y descubrimos que es un programa que predice texto basándose en patrones. Hoy vamos a ver qué pasa cuando le das a ese modelo la capacidad de actuar en el mundo real.

1. ¿Qué es un agente de IA?

Un agente de IA es un sistema que usa un modelo de lenguaje como cerebro para razonar, tomar decisiones y ejecutar acciones de forma autónoma hasta completar una tarea.

El modelo genera texto, el agente hace cosas. Un modelo es como un cerebro en un frasco. Muy inteligente, puede razonar, analizar y generar ideas, pero no tiene manos, no tiene ojos, no puede interactuar con nada fuera de sí mismo. Un agente es ese mismo cerebro conectado a manos, ojos y memoria. Puede buscar información, ejecutar código, leer archivos, llamar APIs, y decidir qué hacer a continuación basándose en lo que observa.

2. Modelo vs Agente: ¿cuál es la diferencia?

Veamos un ejemplo concreto para que la diferencia quede clara.

Tú preguntas: "¿Qué clima hace en Ciudad de México?"

Un modelo:

Recibe tu pregunta
Genera texto basándose en sus datos de entrenamiento
Responde: "No tengo acceso a información en tiempo real, pero el clima en CDMX suele ser templado..."
Fin. No puede hacer más.

Un agente:

Recibe tu pregunta
Piensa: "Necesito datos del clima actual. Tengo una herramienta que consulta APIs de clima."
Actúa: Llama a la API del clima con la ubicación "Ciudad de México"
Observa: Recibe los datos: 22°C, soleado, humedad 45%
Responde: "Ahora mismo en Ciudad de México hay 22°C, está soleado con 45% de humedad."

El modelo está limitado a lo que sabe de su entrenamiento. El agente puede ir a buscar lo que no sabe.

	Modelo	Agente
Genera texto	Si	Si
Usa herramientas	No	Si
Toma decisiones	No	Si
Ejecuta acciones	No	Si
Recuerda contexto entre pasos	No	Si
Trabaja de forma autónoma	No	Si

3. ¿Qué NO es un agente?

Antes de seguir, limpiemos confusiones comunes:

Un chatbot con respuestas predefinidas no es un agente. Si solo sigue un árbol de decisiones fijo, no hay razonamiento ni autonomía.
Un modelo con un prompt muy largo no es un agente. Por más contexto que le des, si no puede ejecutar acciones ni tomar decisiones sobre qué hacer, sigue siendo solo un modelo.
Una automatización con if/else no es un agente. Si el flujo está completamente predefinido por un humano, no hay autonomía.

Un agente combina razonamiento + decisión + acción + observación en un loop que él mismo controla.

4. Los componentes de un agente

Un agente no es una sola cosa mágica. Es una combinación de componentes trabajando juntos.

Modelo (el cerebro)

Es el componente que razona y decide. El modelo de lenguaje analiza la situación, decide qué hacer a continuación y genera las instrucciones para actuar. Sin el modelo, no hay razonamiento.

En el artículo anterior vimos cómo elegir un modelo según sus capacidades. Para agentes, necesitas un modelo que soporte tool use (uso de herramientas), que es la capacidad de describir cuándo necesita llamar a una función externa y con qué parámetros.

Herramientas (las manos)

Las herramientas son funciones que el agente puede ejecutar para interactuar con el mundo exterior. Pueden ser:

APIs externas: clima, bases de datos, servicios web
Ejecución de código: correr scripts, hacer cálculos
Búsqueda: buscar en internet, en documentos, en bases de conocimiento
Acciones en sistemas: crear archivos, enviar emails, desplegar código

Sin herramientas, el agente sería solo un modelo con pasos extra. Las herramientas son lo que le dan la capacidad de actuar.

Memoria (el contexto)

La memoria permite al agente recordar qué ha hecho, qué ha observado y qué ha decidido. Hay dos tipos:

Memoria a corto plazo: la conversación actual, los pasos que ha dado, los resultados que ha obtenido. Esto vive en la ventana de contexto del modelo.
Memoria a largo plazo: información que persiste entre conversaciones. Puede ser una base de datos, un archivo, o cualquier sistema de almacenamiento externo.

Sin memoria, el agente repetiría los mismos errores y no podría construir sobre sus observaciones anteriores.

Instrucciones (el propósito)

Las instrucciones le dicen al agente qué debe hacer y cómo debe comportarse. Esto incluye:

El prompt del sistema que define su rol y restricciones
Los objetivos que debe cumplir
Las reglas que debe seguir

Sin instrucciones claras, el agente no sabría hacia dónde dirigir su razonamiento.

5. El loop: cómo funciona un agente

Ahora que conoces los componentes, veamos cómo interactúan. Un agente funciona en un loop (ciclo) que se repite hasta completar la tarea:

Pensar

El modelo analiza la situación actual: ¿qué me pidieron? ¿qué sé hasta ahora? ¿qué me falta? Decide cuál es el siguiente paso.

Actuar

Basándose en su razonamiento, el agente ejecuta una acción. Puede ser llamar una herramienta, hacer una búsqueda, o ejecutar código.

Observar

El agente recibe el resultado de su acción y lo incorpora a su contexto. ¿Funcionó? ¿Obtuvo lo que necesitaba? ¿Necesita hacer algo más?

Repetir o responder

Si la tarea está completa, el agente genera su respuesta final. Si no, vuelve a Pensar con la nueva información y repite el ciclo.

El modelo responde una vez. El agente itera hasta resolver el problema.

💡 Tip importante: El número de iteraciones del loop depende de la complejidad de la tarea. Una pregunta simple puede resolverse en 1-2 ciclos. Una tarea compleja como "investiga este bug y propón una solución" puede tomar 5-10 ciclos donde el agente lee código, ejecuta tests, analiza errores y propone cambios.

6. ¿Cómo se construye un agente?

Si estás pensando "esto suena complejo de implementar", tienes razón. Conectar un modelo con herramientas, manejar memoria, implementar el loop, manejar errores... son muchas piezas.

Por eso existen SDKs y frameworks que se encargan de la infraestructura para que tú te enfoques en definir qué debe hacer tu agente:

Strands Agents: Un SDK open source de AWS que simplifica la creación de agentes con un enfoque en model-driven development
LangGraph: Framework para construir agentes como grafos de estados
Amazon Bedrock Agents: Servicio administrado de AWS para crear agentes sin manejar infraestructura

Estos frameworks se encargan de:

Implementar el loop (Pensar → Actuar → Observar)
Conectar el modelo con las herramientas
Manejar la memoria y el contexto
Gestionar errores y reintentos

Tu trabajo como desarrollador es definir: ¿qué herramientas tiene disponibles mi agente? ¿qué instrucciones le doy? ¿qué modelo uso?

En el próximo artículo de esta serie vamos a construir tu primer agente de IA paso a paso usando uno de estos frameworks. Vas a ver que con pocas líneas de código puedes tener un agente funcional que resuelve problemas reales.

Preguntas frecuentes

¿Todos los chatbots de IA son agentes?

No. La mayoría de chatbots que usas día a día (como ChatGPT en modo básico) son modelos con una interfaz de conversación. Se convierten en agentes cuando tienen acceso a herramientas y pueden ejecutar acciones, como cuando ChatGPT busca en internet o ejecuta código con Code Interpreter.

¿Un agente puede equivocarse?

Si. Los agentes heredan las limitaciones del modelo que usan como cerebro. Pueden tomar decisiones incorrectas, usar herramientas de forma equivocada, o entrar en loops infinitos. Por eso las instrucciones claras y las restricciones son importantes.

¿Necesito un modelo específico para construir agentes?

Necesitas un modelo que soporte tool use (también llamado function calling). La mayoría de modelos modernos lo soportan: Claude, GPT-4, Llama 3, Nova, entre otros. Puedes acceder a varios de estos a través de Amazon Bedrock.

¿Los agentes son seguros?

Depende de cómo los construyas. Un agente con acceso a herramientas poderosas (como ejecutar código o modificar bases de datos) necesita restricciones claras. Es tu responsabilidad como desarrollador definir qué puede y qué no puede hacer.

Conclusión

Recapitulemos lo que aprendimos:

Un agente de IA es un sistema que usa un modelo como cerebro para razonar, decidir y ejecutar acciones de forma autónoma
La diferencia con un modelo solo: el modelo genera texto, el agente hace cosas
Un agente tiene 4 componentes: modelo (cerebro), herramientas (manos), memoria (contexto) e instrucciones (propósito)
Funciona en un loop: Pensar → Actuar → Observar → Repetir hasta completar la tarea
Existen frameworks y SDKs que simplifican la construcción de agentes para que no tengas que implementar todo desde cero

En el próximo artículo vamos a pasar de la teoría a la práctica: vas a construir tu primer agente de IA funcional, con herramientas reales, en pocas líneas de código.