Conocimientos Previos Recomendados:
- Familiaridad con servicios clave de AWS como Amazon EC2, Amazon S3, AWS Lambda y Amazon SageMaker
- Comprensión del modelo de responsabilidad compartida de AWS
- Familiaridad con AWS Identity and Access Management (IAM) para la seguridad
- Conocimiento de la infraestructura global de AWS (Regiones, Zonas de Disponibilidad)
- Familiaridad con los modelos de precios de los servicios de AWS
Detalles del Examen
- Código: AIF-C01
- Duración: 90 minutos
- Costo: 100 USD
- Número de Preguntas: 65 preguntas en total (50 afectan la puntuación, 15 son sin puntaje)
- Puntuación: Escala de 100 a 1000, puntuación mínima para aprobar: 700
- Calificación: "Aprobado" o "Desaprobado"
Tipos de Preguntas
- Opción múltiple: Una respuesta correcta y tres incorrectas
- Respuesta múltiple: Dos o más respuestas correctas de cinco o más opciones
- Ordenación: Colocar de 3 a 5 respuestas en el orden correcto
- Correspondencia: Unir respuestas con una lista de 3 a 7 peticiones
- Caso práctico: Un escenario con dos o más preguntas relacionadas
Dominios del Examen
Dominio 1: Fundamentos de IA y ML (20% del examen)
1.1 Explicar los conceptos y términos básicos de la IA
Definiciones Clave:
- Inteligencia Artificial (IA): Campo de la informática enfocado en crear sistemas capaces de realizar tareas que imitan la inteligencia humana
- Machine Learning (ML): Subconjunto de la IA que enseña a las computadoras a aprender de los datos para mejorar su rendimiento
- Aprendizaje Profundo (Deep Learning): Subconjunto del ML que utiliza redes neuronales artificiales (ANN) con múltiples capas
- IA Generativa: Subconjunto del aprendizaje profundo que produce datos nuevos (texto, imágenes, audio, datos sintéticos)
- Modelo de Lenguaje Grande (LLM): Modelos de aprendizaje profundo entrenados con enormes volúmenes de datos de texto
Tipos de Inferencia:
- Inferencia por lotes (Batch inference): Procesamiento de grandes volúmenes de datos de una sola vez
- Inferencia en tiempo real (Real-time inferencing): Procesamiento rápido para aplicaciones que requieren respuestas inmediatas
Tipos de Datos:
- Etiquetados y no etiquetados: Con o sin categoría asignada
- Estructurados: Datos tabulares
- Semi-estructurados: Con metadatos como JSON o XML
- No estructurados: Sin modelo definido (texto, imágenes, videos)
Paradigmas del Machine Learning:
- Aprendizaje Supervisado: Modelo entrenado con datos etiquetados (clasificación y regresión)
- Aprendizaje No Supervisado: Encuentra patrones en datos no etiquetados (clustering, reducción de dimensionalidad)
- Aprendizaje por Refuerzo: Agente aprende mediante prueba y error con recompensas/penalizaciones
1.2 Identificar casos prácticos de uso de la IA
Cuándo usar IA/ML:
- Ayudar en la toma de decisiones humanas
- Escalar soluciones
- Automatizar tareas repetitivas
Cuándo NO usar IA/ML:
- Análisis de costo-beneficio desfavorable
- Soluciones deterministas requeridas
- Áreas muy reguladas donde se requiere explicabilidad estricta
Servicios de IA/ML administrados por AWS:
- Amazon SageMaker: Plataforma integral para construir, entrenar y desplegar modelos de ML
- Amazon Transcribe: Convierte voz a texto (ASR)
- Amazon Translate: Traducción automática neuronal
- Amazon Comprehend: NLP para extraer información del texto
- Amazon Lex: Interfaces conversacionales (chatbots)
- Amazon Polly: Convierte texto a voz (TTS)
1.3 Describir el ciclo de vida de desarrollo de ML
Componentes de una Canalización de ML:
- Recopilación de datos
- Análisis exploratorio de datos (EDA)
- Procesamiento previo de datos
- Ingeniería de características
- Entrenamiento del modelo
- Ajuste de hiperparámetros
- Evaluación del modelo
- Implementación
- Supervisión
Métodos de Implementación:
- Servicio de API administrado: Endpoints de Amazon SageMaker
- API autohospedada: Despliegue en servidores propios (Amazon EC2)
Servicios de AWS por Etapa:
- Preparación de datos: Amazon SageMaker Data Wrangler, Feature Store
- Construcción y entrenamiento: Amazon SageMaker Notebooks, Model Training
- Implementación y monitoreo: Amazon SageMaker Pipelines, Model Monitor
Dominio 2: Fundamentos de la IA Generativa (24% del examen)
2.1 Explicar los conceptos básicos de la IA generativa
Conceptos Fundamentales:
- Tokens: Unidades de texto más pequeñas que un modelo puede procesar
- Incrustaciones (Embeddings): Representaciones numéricas que capturan significado semántico
- Ingeniería de peticiones (Prompt Engineering): Diseño de entradas para guiar al modelo
- Modelos fundacionales: Modelos de ML a gran escala, preentrenados con enormes cantidades de datos
- Modelos multimodales: Procesan múltiples tipos de datos (texto, imágenes, audio)
- Modelos de difusión: Crean datos realistas revirtiendo un proceso de adición de ruido
Casos de Uso:
- Generación de imágenes, video y audio
- Resúmenes de texto
- Chatbots
- Traducción
- Generación de código
- Motores de búsqueda y recomendación
2.2 Comprender las capacidades y limitaciones de la IA generativa
Ventajas:
- Adaptabilidad a diversas tareas
- Capacidad de respuesta en tiempo real
- Simplicidad para automatizar generación de contenido
Desventajas y Desafíos:
- Alucinaciones: Información incorrecta que parece plausible
- Interpretabilidad: Modelos "caja negra"
- Inexactitud y falta de determinismo
- Toxicidad: Potencial para contenido ofensivo
2.3 Describir la infraestructura y tecnologías de AWS para IA generativa
Servicios de AWS:
- Amazon Bedrock: Acceso a modelos fundacionales a través de API
- Amazon SageMaker JumpStart: Centro de ML con modelos preentrenados
- Amazon Q: Asistente de IA generativa para empresas
- PartyRock: Playground de Amazon Bedrock
Dominio 3: Aplicaciones de Modelos Fundacionales (28% del examen)
3.1 Consideraciones de diseño para aplicaciones con modelos fundacionales
Criterios para Seleccionar Modelos:
- Costo: Precios de suscripción, recursos de cómputo
- Modalidad: Tipos de datos soportados
- Latencia: Velocidad de respuesta
- Tamaño y complejidad del modelo
- Longitud de entrada/salida
Parámetros de Inferencia:
- Temperatura: Controla aleatoriedad (alta = creativo, baja = determinista)
Generación Aumentada por Recuperación (RAG):
- Optimiza salida de LLM al referenciar base de conocimientos externa
- Combina recuperación de información con generación de texto
- Bases de conocimiento para Amazon Bedrock es implementación de RAG
Bases de Datos Vectoriales:
- Almacenan embeddings para búsquedas de similitud rápidas
- Servicios AWS: OpenSearch Service, Aurora, Neptune, DocumentDB, RDS PostgreSQL
Personalización de Modelos:
- Pre-entrenamiento: Extremadamente costoso, desde cero
- Ajuste (Fine-Tuning): Adaptar modelo preentrenado, menos costoso
- Aprendizaje en contexto: Guiar con ejemplos en prompt, muy rentable
- RAG: Equilibrio, actualiza conocimiento sin reentrenamiento
3.2 Técnicas eficaces de ingeniería de peticiones
Técnicas de Prompting:
- Zero-shot: Sin ejemplos previos
- One-shot / Few-shot: Con uno o varios ejemplos
- Cadena de pensamiento: Razonamiento paso a paso
Riesgos:
- Inyección de peticiones: Manipulación maliciosa del prompt
- Jailbreak: Ignorar filtros de seguridad
- Envenenamiento: Datos maliciosos que degradan rendimiento
3.3 Entrenamiento y ajuste de modelos fundacionales
Métodos de Ajuste:
- Ajuste de instrucciones: Con ejemplos de instrucciones y respuestas
- Adaptación a dominios específicos: Datos de campo particular
- RLHF (Aprendizaje por refuerzo con retroalimentación humana): Alinear con preferencias humanas
3.4 Evaluación del rendimiento del modelo fundacional
Enfoques:
- Evaluación humana: Estándar de oro pero costoso
- Conjuntos de datos de referencia: GLUE, SuperGLUE
Métricas:
- ROUGE: Para resúmenes de texto
- BLEU: Para traducción automática
- BERTScore: Similitud semántica con embeddings de BERT
Dominio 4: Directrices de la IA Responsable (14% del examen)
4.1 Desarrollo de sistemas de IA responsables
Características de IA Responsable:
- Equidad
- Inclusividad
- Robustez
- Seguridad
- Veracidad
- Transparencia
- Gobernanza
Sesgo y Equidad:
- Tipos: algorítmico, de datos, de muestreo, de prejuicio
- Efectos: resultados injustos, overfitting/underfitting
Herramientas AWS:
- Amazon SageMaker Clarify: Detecta sesgos y explica predicciones
- Amazon SageMaker Model Monitor: Supervisa modelos en producción
- Amazon Augmented AI (A2I): Revisiones humanas
- Guardrails para Amazon Bedrock: Políticas de seguridad para IA generativa
4.2 Modelos transparentes y explicables
Transparencia vs. Modelos "Caja Negra":
- Transparentes: fáciles de interpretar (árboles de decisión)
- Opacos: difíciles de entender (redes neuronales profundas)
Herramientas:
- Model Cards de Amazon SageMaker: Documentan información del modelo
- AWS AI Service Cards: Información sobre uso responsable
Dominio 5: Seguridad, Cumplimiento y Gobernanza (14% del examen)
5.1 Métodos para proteger sistemas de IA
Servicios de Seguridad AWS:
- AWS IAM: Gestión de acceso con principio de mínimo privilegio
- Cifrado: En reposo y en tránsito con AWS KMS
- Amazon Macie: Descubre y protege datos sensibles (PII)
- AWS PrivateLink: Conectividad privada entre VPCs
- Modelo de responsabilidad compartida: AWS seguridad de la nube, cliente en la nube
Citación y Origen de Datos:
- Linaje de datos: Rastrear origen y transformaciones
- Catalogación: AWS Glue Data Catalog para organizar metadatos
5.2 Normativas de gobernanza y cumplimiento
Estándares:
- ISO: ISO/IEC 27001 (seguridad), ISO/IEC 42001 (gestión de IA)
- SOC: Controles de Organización y Servicio
Servicios AWS para Cumplimiento:
- AWS Artifact: Acceso a informes de cumplimiento
- AWS Config: Evalúa y supervisa configuraciones
- AWS Audit Manager: Ayuda con auditorías continuas
- AWS CloudTrail: Registra actividad de cuenta y API
- AWS Trusted Advisor: Recomendaciones de optimización
Estrategias de Gobernanza:
- Políticas de ciclo de vida de datos
- Registro (logging)
- Residencia de datos
- Supervisión
- Retención
Consejos para el Examen
- Practica con casos de uso reales de cada servicio de AWS mencionado
- Comprende las diferencias entre los tipos de aprendizaje automático
- Familiarízate con las métricas de evaluación y cuándo usar cada una
- Estudia los aspectos éticos y de IA responsable
- Conoce las características de seguridad y cumplimiento de AWS
- Practica la ingeniería de prompts y comprende RAG
- Revisa los modelos de precios y factores de selección de modelos
¡Buena suerte en tu certificación!
Top comments (0)