Aperçu
Welcome to the world of Generative AI and Large Language Models (LLMs)—where technology mirrors human creativity and intelligence. This course is designed to provide you with a comprehensive understanding of generative models, including their evolution, applications, and the underlying architectures that make them possible.
Throughout the modules, you'll explore various generative techniques such as GANs (Generative Adversarial Networks), VAEs (Variational Autoencoders), diffusion models, and multimodal AI. You'll also gain hands-on experience with tools like OpenAI's GPT, Hugging Face, Streamlit, and MLflow, ensuring you can deploy and fine-tune models for real-world applications.
Programme
- Introduction à l'IA générative
Faites vos premiers pas dans le monde passionnant de l'IA générative, où vous distinguerez entre divers types de modèles, y compris les GANs, VAEs, transformateurs, et modèles de diffusion. Vous explorerez l'évolution des technologies génératives et examinerez leurs applications dans le monde réel tout en considérant les implications éthiques importantes qui accompagnent ces outils puissants.
- Grands Modèles de Langage (LLMs) & Architecture des Transformateurs
Explorez l'architecture révolutionnaire des transformateurs qui alimente les modèles de langage les plus avancés d'aujourd'hui. Vous acquerrez une expérience pratique avec les mécanismes d'attention, apprendrez comment les transformateurs traitent et génèrent du texte, et expérimenterez le réglage fin en utilisant les Transformers de Hugging Face. Ce module fait le lien entre la théorie et l'implémentation pratique, vous équipant de compétences pour travailler directement avec la technologie LLM à la pointe du progrès.
- Applications Pratiques des LLMs
Élevez vos connaissances en LLMs au niveau supérieur avec des applications pratiques qui alimentent les systèmes d'IA modernes. Vous mettrez en œuvre la génération enrichie par la récupération pour améliorer les réponses avec des connaissances externes, utiliserez des techniques de sortie structurée pour un formatage cohérent, et déploierez des modèles via des APIs. Ce module aborde à la fois la théorie et la pratique des applications modernes de LLM, vous montrant comment construire des applications du monde réel avec les modèles de langage les plus avancés d'aujourd'hui.
- Modèles de Diffusion
Découvrez la technologie derrière les systèmes de génération d'images les plus impressionnants d'aujourd'hui. Vous apprendrez comment les modèles de diffusion transforment graduellement du bruit aléatoire en visuels époustouflants à travers un processus itératif de débruitage. À travers des exercices de codage pratiques, vous implémenterez votre propre modèle de diffusion en utilisant PyTorch, explorerez Stable Diffusion pour la génération texte-image, et comparerez la diffusion avec des approches antérieures comme les GANs et les VAEs pour comprendre pourquoi la diffusion est devenue le paradigme dominant dans la génération visuelle.
- IA Générative Multimodale
Découvrez comment les modèles d'IA de pointe peuvent intégrer texte, images et audio pour créer de véritables expériences multimodales. Vous enquêterez sur des modèles vision-langage comme CLIP et BLIP qui comprennent les relations entre texte et images, implémenterez l'IA basée sur l'audio avec Whisper pour la reconnaissance vocale, et acquerrez une expérience pratique en construisant des systèmes capables de traiter plusieurs types de données simultanément. Ce module vous prépare à l'avenir de plus en plus multimodal de l'IA générative où les modèles combinent sans effort différents types d'information.
Enseigné par
Professionals from the Industry
Matières
Computer Science