Una guía completa para dominar los servicios de IA y Machine Learning de AWS
📚 Introducción
Esta guía de estudio está diseñada para ayudarte a revisar y consolidar tu comprensión de los servicios clave de IA y machine learning de AWS. Utilízala para evaluar tus conocimientos, identificar áreas de mejora y prepararte para preguntas complejas sobre la aplicación e integración de estas herramientas.
🎯 Cuestionario de Repaso
Responde las siguientes preguntas en 2 o 3 oraciones, basándote únicamente en la información proporcionada en el contexto de origen.
1. Amazon SageMaker
¿Cuál es el propósito principal de Amazon SageMaker y qué componentes clave están involucrados en su proceso de entrenamiento y despliegue?
2. Amazon Bedrock
Explique qué es Amazon Bedrock y cómo facilita el acceso a modelos de IA generativa de terceros.
3. RAG (Retrieval Augmented Generation)
¿Qué es la Generación Aumentada por Recuperación (RAG) y por qué se considera una alternativa más rápida y económica que el "fine-tuning"?
4. SageMaker Model Monitor
¿Cómo ayuda Amazon SageMaker Model Monitor a mantener la calidad de los modelos en producción y con qué otro servicio de SageMaker se integra para detectar sesgos?
5. SageMaker Autopilot
Describa la función de SageMaker Autopilot. ¿Qué tipos de problemas de machine learning puede resolver y qué algoritmos utiliza?
6. Amazon Q Developer
¿Qué es Amazon CodeWhisperer / Amazon Q Developer y cómo ayuda a los desarrolladores a escribir código?
7. Amazon Q Business
¿Cuál es la función de Amazon Q Business y cómo gestiona la seguridad y el control de acceso a la información empresarial?
8. SageMaker Debugger
Explique el rol de SageMaker Debugger en el entrenamiento de modelos. ¿Qué tipo de información captura y cómo alerta a los usuarios sobre problemas?
9. SageMaker Feature Store
¿Cuál es la diferencia entre el "online store" y el "offline store" en Amazon SageMaker Feature Store?
10. Guardrails de Implementación
¿Qué son los "Guardrails" de implementación de SageMaker y qué estrategias de despliegue de modelos soportan?
✅ Clave de Respuestas
- Amazon SageMaker
Amazon SageMaker es un servicio de machine learning que proporciona herramientas para construir, entrenar y desplegar modelos a escala, manejando todo el flujo de trabajo de ML. Su proceso de entrenamiento y despliegue incluye componentes como la aplicación cliente, el alojamiento del modelo, el entrenamiento del modelo, los artefactos del modelo en S3, los datos de entrenamiento en S3 y las imágenes de código de inferencia y entrenamiento en ECR.
- Amazon Bedrock
Amazon Bedrock es una API para modelos fundacionales de IA generativa que permite invocar modelos de chat, texto o imágenes. Facilita el acceso a modelos de terceros facturando su uso a través de AWS según las tarifas del proveedor, aunque requiere que el usuario solicite acceso al modelo y complete información adicional.
- RAG (Retrieval Augmented Generation)
La Generación Aumentada por Recuperación (RAG) permite a un LLM consultar una base de datos externa en lugar de depender únicamente de sus datos de entrenamiento, funcionando como un "examen a libro abierto". Se considera más rápido y económico que el "fine-tuning" porque la actualización de la información solo requiere actualizar la base de datos, sin necesidad de reentrenar el modelo.
- SageMaker Model Monitor
Amazon SageMaker Model Monitor ayuda a mantener la calidad enviando alertas a través de CloudWatch sobre desviaciones de calidad en los modelos desplegados, visualizando la deriva de datos y detectando anomalías. Se integra con SageMaker Clarify para detectar y monitorear sesgos potenciales, como desequilibrios entre diferentes grupos demográficos.
- SageMaker Autopilot
SageMaker Autopilot, también conocido como AutoML, automatiza la selección de algoritmos, el preprocesamiento de datos, el ajuste de modelos y la infraestructura. Puede resolver problemas de clasificación binaria, clasificación multiclase y regresión utilizando algoritmos como Linear Learner, XGBoost y Deep Learning (MLPs).
- Amazon Q Developer
Amazon CodeWhisperer / Amazon Q Developer es un "compañero de codificación de IA" que proporciona sugerencias de código en tiempo real dentro de varios IDEs. Se basa en LLMs entrenados en miles de millones de líneas de código para sugerir bloques de código a partir de comentarios descriptivos escritos por el desarrollador.
- Amazon Q Business
Amazon Q Business es un asistente de IA para información empresarial que responde preguntas, genera contenido y completa tareas utilizando RAG. Gestiona la seguridad utilizando IAM Identity Center y SAML 2.0 para el control de acceso de usuarios, además de incluir guardrails y encriptar los datos con KMS.
- SageMaker Debugger
SageMaker Debugger ayuda a depurar modelos guardando periódicamente su estado interno, como gradientes y tensores, durante el entrenamiento. Alerta a los usuarios sobre condiciones no deseadas mediante reglas predefinidas que, al activarse, registran un evento de CloudWatch y pueden detener el entrenamiento o enviar notificaciones.
- SageMaker Feature Store
En Amazon SageMaker Feature Store, el "online store" está diseñado para el acceso de baja latencia a características, utilizando las API PutRecord/GetRecord. Por otro lado, el "offline store" es un repositorio en S3 destinado al acceso por lotes para entrenamiento o inferencia batch, y puede ser consultado por servicios como Athena o Data Wrangler.
- Guardrails de Implementación
Los "Guardrails" de implementación de SageMaker son salvaguardas que controlan el cambio de tráfico hacia nuevos modelos en endpoints de inferencia. Soportan despliegues "Blue/Green" (todo a la vez), despliegues canarios (una pequeña porción del tráfico) y despliegues lineales (en pasos espaciados linealmente), e incluyen la capacidad de reversión automática.
📝 Preguntas de Ensayo Sugeridas
1. Fine-tuning vs RAG
Compare y contraste los enfoques de "fine-tuning" (ajuste fino) y Generación Aumentada por Recuperación (RAG) para incorporar información nueva o propietaria en un LLM dentro de Amazon Bedrock. Discuta las ventajas y desventajas de cada método en términos de costo, velocidad y mantenimiento.
2. Ciclo de Vida ML con SageMaker
Describa el ciclo de vida completo de un modelo de machine learning utilizando el ecosistema de Amazon SageMaker, desde la preparación de datos con Data Wrangler hasta el monitoreo post-despliegue con Model Monitor. Explique cómo herramientas como Experiments, Debugger y ML Lineage Tracking contribuyen a la gobernanza y reproducibilidad del proceso.
3. Herramientas No-Code para Analistas
Explique cómo un analista de negocios sin experiencia en codificación puede utilizar Amazon SageMaker Canvas y Amazon Q Business para obtener insights y crear aplicaciones de IA. Detalle el flujo de trabajo en cada herramienta y cómo podrían complementarse.
4. Seguridad en AWS AI/ML
Discuta las características de seguridad implementadas en Amazon Bedrock y Amazon SageMaker. ¿Cómo abordan estos servicios la protección de datos sensibles durante el entrenamiento, la inferencia y el almacenamiento, tanto en tránsito como en reposo?
5. Agentes de LLM en Bedrock
Analice el rol de los "agentes" de LLM en Amazon Bedrock. Explique cómo los "Action Groups", las "Knowledge Bases" y el "Code Interpreter" permiten a un modelo de lenguaje realizar tareas complejas que van más allá de la simple generación de texto.
📖 Glosario de Términos Clave
Término | Definición |
---|---|
Agentes de LLM | Un LLM dotado de memoria, capacidad de planificación y herramientas (como funciones Lambda) para descomponer una solicitud y ejecutar tareas. |
Amazon Bedrock | Una API para modelos fundacionales de IA generativa que permite invocar modelos preconstruidos, ajustados o propios para tareas de chat, texto e imágenes. |
Amazon Q Developer | Un asistente de codificación con IA que proporciona sugerencias de código en tiempo real, escaneos de seguridad y seguimiento de referencias de código abierto. |
Amazon Q Business | Un asistente de IA para información empresarial que utiliza RAG para responder preguntas y generar contenido a partir de datos corporativos, con más de 40 conectores incorporados. |
Amazon QuickSight | Un servicio de análisis de negocio en la nube, serverless, que permite a los usuarios crear visualizaciones, realizar análisis ad hoc y obtener insights de negocio. |
Amazon SageMaker | Un servicio de machine learning que proporciona herramientas para construir, entrenar y desplegar modelos de ML a escala, cubriendo todo el flujo de trabajo. |
SageMaker Autopilot | Una función de SageMaker que automatiza la selección de algoritmos, el preprocesamiento de datos, el ajuste de modelos y la infraestructura para problemas de clasificación y regresión. |
SageMaker Canvas | Una herramienta de machine learning sin código para analistas de negocio que permite cargar datos CSV, seleccionar una columna a predecir y construir modelos de clasificación o regresión. |
SageMaker Clarify | Un servicio que ayuda a explicar el comportamiento del modelo y a detectar sesgos potenciales en los datos y modelos, integrándose con Model Monitor. |
SageMaker Data Wrangler | Una herramienta con interfaz visual dentro de SageMaker Studio para importar, transformar, analizar y exportar datos para machine learning, con más de 300 transformaciones disponibles. |
SageMaker Debugger | Una herramienta que guarda periódicamente el estado interno de un modelo durante el entrenamiento (gradientes, tensores) y permite definir reglas para detectar y perfilar cuellos de botella y otros problemas. |
SageMaker Edge Manager | Un agente de software para dispositivos de borde que utiliza modelos optimizados con SageMaker Neo y recopila datos para monitoreo y reentrenamiento. |
SageMaker Experiments | Una característica que permite organizar, capturar, comparar y buscar trabajos de machine learning. |
SageMaker Feature Store | Un repositorio especialmente diseñado para almacenar, descubrir y compartir características de machine learning, organizado en un "online store" de baja latencia y un "offline store" para lotes. |
SageMaker JumpStart | Un servicio que ofrece modelos y algoritmos de código abierto listos para usar con un solo clic, provenientes de zoológicos de modelos para tareas como NLP y detección de objetos. |
SageMaker ML Lineage Tracking | Un servicio que crea y almacena el historial del flujo de trabajo de ML (MLOps), rastreando entidades como artefactos, acciones y experimentos para auditoría y cumplimiento. |
SageMaker Model Monitor | Un servicio que envía alertas sobre desviaciones de calidad en los modelos desplegados, monitoreando la deriva en la calidad de los datos, la calidad del modelo, el sesgo y la atribución de características. |
SageMaker Notebooks | Entornos de Jupyter Notebooks que se ejecutan en instancias EC2 y permiten dirigir el proceso de ML, acceder a datos de S3 y utilizar bibliotecas como Scikit-learn, Spark y TensorFlow. |
SageMaker Studio | Un IDE visual para machine learning que integra muchas de las características de SageMaker, permitiendo crear y compartir notebooks y cambiar configuraciones de hardware sin gestionar la infraestructura. |
Base de datos de vectores | Una base de datos que almacena datos junto con sus vectores de "embedding" computados, permitiendo búsquedas de similitud semántica (K-Nearest Neighbor). |
Knowledge Bases de Bedrock | Un servicio en Bedrock que permite cargar documentos o datos estructurados para utilizarlos en RAG, gestionando la fragmentación de datos y la creación de "embeddings". |
Embedding | Un vector grande asociado a un dato, que representa un punto en un espacio multidimensional donde elementos similares están cerca unos de otros. |
Fine-tuning | El proceso de adaptar un modelo de lenguaje grande existente a un caso de uso específico mediante entrenamiento adicional con datos propios y etiquetados. |
RAG | Una técnica que permite a un LLM consultar una base de datos externa (como una base de datos de vectores) para incorporar información nueva o propietaria en sus respuestas sin necesidad de reentrenamiento. |
Guardrails de Bedrock | Un servicio que filtra contenido para prompts y respuestas en modelos de texto, incluyendo filtros de palabras, temas, blasfemias, PII y una verificación de anclaje contextual para prevenir alucinaciones. |
Guardrails de implementación | Salvaguardas en SageMaker que controlan cómo se transfiere el tráfico a nuevos modelos, soportando despliegues "Blue/Green", canarios y lineales, con reversiones automáticas. |
Pruebas Sombra | Una función de SageMaker que evalúa un nuevo modelo (variante sombra) comparando su rendimiento con el modelo actualmente en producción antes de promoverlo. |
🎓 Consejos para el Examen
- Practica con casos de uso reales: Familiarízate con escenarios donde cada servicio sería la mejor opción
- Comprende las integraciones: Muchas preguntas se enfocan en cómo los servicios trabajan juntos
- Memoriza las diferencias clave: Especialmente entre fine-tuning y RAG, online vs offline stores
- Revisa los casos de uso específicos: Cada servicio tiene fortalezas particulares que debes conocer
📚 Recursos Adicionales
- Documentación oficial de AWS AI/ML
- AWS Skill Builder - Cursos de IA
- AWS Whitepapers sobre Machine Learning
¡Buena suerte en tu certificación AWS AI Practitioner! 🚀
¿Te ha resultado útil esta guía? ¡Compártela con otros desarrolladores que estén preparándose para la certificación!
Top comments (0)