Aperçu
Learn to build AI that sees, hears, and understands the world in an integrated way. This course takes you beyond single-modality models, teaching you to architect applications that connect different data types like text, images, and speech.
Starting with text-to-image generation, you will progress to integrating various AI components and orchestrating the full power of Azure AI Services to build sophisticated, cross-modal solutions. By the end, you'll be equipped to design the next generation of intelligent, multi-faceted AI applications.
Programme
- Intégration des composants d'IA multimodale
Ce module introduit les concepts fondamentaux de l'IA multimodale. Vous apprendrez les modèles architecturaux pour combiner différents composants d'IA, tels que les modèles de texte et d'image, et passerez d'une intégration de base à la création de systèmes complexes capables de raisonner à travers plusieurs types de données.
- Génération d'images à partir de texte
Ce module propose une plongée approfondie dans la tâche populaire et créative de génération d'images à partir de descriptions textuelles. Vous explorerez les modèles qui alimentent cette technologie, comme DALL·E, et apprendrez des techniques de sollicitation basiques et avancées pour concevoir et affiner des sorties visuelles spécifiques et de haute qualité.
- Applications intermodales avec Azure AI Vision
Ce module se concentre sur la mise en œuvre pratique en utilisant un outil puissant et spécialisé. Vous exploiterez les fonctionnalités d'Azure AI Vision pour créer et optimiser des applications intermodales telles que la description d'images et la recherche visuelle. Vous apprendrez comment ce service unique peut analyser le contenu visuel pour générer des descriptions textuelles riches et extraire le texte intégré (OCR), fournissant les composants de base pour des solutions multimodales sophistiquées.
- Intégration avancée de l'IA avec les services Azure
Ce module de synthèse repose sur votre expertise approfondie en Azure AI Vision. Vous apprendrez à intégrer vos applications de vision avec d'autres services puissants d'Azure AI, tels que le Langage et la Parole, pour créer des solutions complètes de bout en bout. L'accent sera mis sur l'orchestration de ces services distincts pour développer une application sophistiquée qui résout un problème commercial réel, démontrant votre capacité à concevoir et construire un système multimodal complet depuis le début.
Enseigné par
Microsoft
Matières
Artificial Intelligence