Ce que vous devez savoir avant
Vous commencez

Débute 7 June 2026 07:32

Se termine 7 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Programmation de l'IA Générative : Unité 3

Maîtrisez l'IA multimodale en explorant la pré-formation contrastive langue-image, les modèles de diffusion latente et la génération texte-image avec des techniques pratiques de fine-tuning.
via Coursera

2889 Cours


8 hours 17 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Unlock the full potential of generative AI with our advanced course module focused on state-of-the-art multimodal models. This course is designed for learners eager to bridge the gap between images and text, and to master the latest techniques in AI-driven content generation.

You’ll begin by exploring the foundational concepts behind multimodal models, learning how contrastive language-image pre-training enables seamless integration of visual and textual data. Discover how these models power innovative applications like semantic image search, allowing you to query image content without manual labeling.

Dive deeper into the mechanics of latent diffusion models and unravel the inner workings of stable diffusion, gaining the skills to transform text prompts into entirely new, never-before-seen images. The course also covers essential strategies for evaluating generative models and introduces efficient methods for fine-tuning and adapting pre-trained models to new styles and subjects.

By the end, you’ll be equipped to build, adapt, and optimize cutting-edge text-to-image systems—ready to innovate in creative, research, or commercial settings.

Programme

  • Programmer l'IA générative : Unité 3
  • Ce module explore l'IA générative multimodale, en se concentrant sur les modèles qui relient les images et le texte. Les apprenants découvrent la pré-formation contraste langage-image pour la recherche d'images sémantiques et comprennent le fonctionnement de la diffusion latente et de la diffusion stable pour la génération d'images à partir de texte. Le module couvre ensuite l'évaluation des modèles génératifs, le réglage fin efficace en paramètres, et les techniques pour enseigner aux modèles pré-entraînés de nouveaux styles et sujets. Il se termine par des méthodes pour optimiser les modèles de diffusion pour une génération d'images plus rapide et quasi en temps réel, dotant les étudiants d'une compréhension conceptuelle et de compétences pratiques dans les systèmes d'IA multimodale avancés.

Enseigné par

Pearson


Matières

Computer Science