Ce que vous devez savoir avant
Vous commencez

Débute 6 June 2026 09:49

Se termine 6 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Intégrations d'IA multimodales et intermodales

Découvrez comment créer des applications d'IA qui intègrent de manière transparente du texte, des images et de la parole grâce à Azure AI Services pour des solutions multimodales sophistiquées.
Microsoft via Coursera

Microsoft

2874 Cours


19 hours 55 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Learn to build AI that sees, hears, and understands the world in an integrated way. This course takes you beyond single-modality models, teaching you to architect applications that connect different data types like text, images, and speech.

Starting with text-to-image generation, you will progress to integrating various AI components and orchestrating the full power of Azure AI Services to build sophisticated, cross-modal solutions. By the end, you'll be equipped to design the next generation of intelligent, multi-faceted AI applications.

Programme

  • Intégration des composants d'IA multimodale
  • Ce module introduit les concepts fondamentaux de l'IA multimodale. Vous apprendrez les modèles architecturaux pour combiner différents composants d'IA, tels que les modèles de texte et d'image, et passerez d'une intégration de base à la création de systèmes complexes capables de raisonner à travers plusieurs types de données.
  • Génération d'images à partir de texte
  • Ce module propose une plongée approfondie dans la tâche populaire et créative de génération d'images à partir de descriptions textuelles. Vous explorerez les modèles qui alimentent cette technologie, comme DALL·E, et apprendrez des techniques de sollicitation basiques et avancées pour concevoir et affiner des sorties visuelles spécifiques et de haute qualité.
  • Applications intermodales avec Azure AI Vision
  • Ce module se concentre sur la mise en œuvre pratique en utilisant un outil puissant et spécialisé. Vous exploiterez les fonctionnalités d'Azure AI Vision pour créer et optimiser des applications intermodales telles que la description d'images et la recherche visuelle. Vous apprendrez comment ce service unique peut analyser le contenu visuel pour générer des descriptions textuelles riches et extraire le texte intégré (OCR), fournissant les composants de base pour des solutions multimodales sophistiquées.
  • Intégration avancée de l'IA avec les services Azure
  • Ce module de synthèse repose sur votre expertise approfondie en Azure AI Vision. Vous apprendrez à intégrer vos applications de vision avec d'autres services puissants d'Azure AI, tels que le Langage et la Parole, pour créer des solutions complètes de bout en bout. L'accent sera mis sur l'orchestration de ces services distincts pour développer une application sophistiquée qui résout un problème commercial réel, démontrant votre capacité à concevoir et construire un système multimodal complet depuis le début.

Enseigné par

Microsoft


Matières

Artificial Intelligence