Resumen
Welcome to the world of Generative AI and Large Language Models (LLMs)—where technology mirrors human creativity and intelligence. This course is designed to provide you with a comprehensive understanding of generative models, including their evolution, applications, and the underlying architectures that make them possible.
Throughout the modules, you'll explore various generative techniques such as GANs (Generative Adversarial Networks), VAEs (Variational Autoencoders), diffusion models, and multimodal AI. You'll also gain hands-on experience with tools like OpenAI's GPT, Hugging Face, Streamlit, and MLflow, ensuring you can deploy and fine-tune models for real-world applications.
Programa
- Introducción a la IA Generativa
Da tus primeros pasos en el emocionante mundo de la IA generativa, donde distinguirás entre varios tipos de modelos incluyendo GANs, VAEs, transformadores y modelos de difusión. Explorarás la evolución de las tecnologías generativas y examinarás sus aplicaciones en el mundo real, mientras consideras las importantes implicaciones éticas que acompañan a estas poderosas herramientas.
- Modelos de Lenguaje de Gran Escala (LLMs) y Arquitectura Transformer
Explora la arquitectura revolucionaria de transformadores que impulsa los modelos de lenguaje más avanzados de hoy en día. Obtendrás experiencia práctica con mecanismos de auto-atención, aprenderás cómo los transformadores procesan y generan texto, y experimentarás con el ajuste fino utilizando los Transformadores de Hugging Face. Este módulo une la teoría con la implementación práctica, equipándote con habilidades para trabajar directamente con la tecnología de LLM de vanguardia.
- Aplicaciones Prácticas de LLMs
Lleva tu conocimiento de LLM al siguiente nivel con aplicaciones prácticas que energizan los sistemas de IA modernos. Implementarás la generación aumentada por recuperación para mejorar las respuestas con conocimiento externo, usarás técnicas de salida estructurada para un formato consistente y desplegarás modelos a través de APIs. Este módulo aborda tanto la teoría como la práctica detrás de las aplicaciones modernas de LLM, mostrándote cómo construir aplicaciones del mundo real con los modelos de lenguaje más avanzados de hoy.
- Modelos de Difusión
Descubre la tecnología detrás de los sistemas de generación de imágenes más impresionantes de la actualidad. Aprenderás cómo los modelos de difusión transforman gradualmente el ruido aleatorio en visuales impresionantes a través de un proceso iterativo de eliminación de ruido. A través de ejercicios prácticos de codificación, implementarás tu propio modelo de difusión usando PyTorch, explorarás la Difusión Estable para generación de texto a imagen, y compararás la difusión con enfoques anteriores como GANs y VAEs para entender por qué la difusión se ha convertido en el paradigma dominante en la generación visual.
- IA Generativa Multimodal
Descubre cómo los modelos de IA de vanguardia pueden integrar texto, imágenes y audio para crear experiencias verdaderamente multimodales. Investigarás modelos de visión-lenguaje como CLIP y BLIP que comprenden las relaciones entre texto e imágenes, implementarás IA basada en audio con Whisper para reconocimiento de voz, y obtendrás experiencia práctica construyendo sistemas que pueden procesar múltiples tipos de datos simultáneamente. Este módulo te prepara para el futuro cada vez más multimodal de la IA generativa, donde los modelos combinan sin problemas diferentes tipos de información.
Impartido por
Professionals from the Industry
Materias
Computer Science