Ce que vous devez savoir avant
Vous commencez

Débute 9 July 2026 04:52

Se termine 9 July 2026

00 Jours

00 Heures

00 Minutes

00 Secondes

S'inscrire

Intégrations d'IA multimodales et intermodales

Découvrez comment créer des applications d'IA qui intègrent de manière transparente du texte, des images et de la parole grâce à Azure AI Services pour des solutions multimodales sophistiquées.

Microsoft via Coursera

19 hours 55 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Learn to build AI that sees, hears, and understands the world in an integrated way. This course takes you beyond single-modality models, teaching you to architect applications that connect different data types like text, images, and speech.

Starting with text-to-image generation, you will progress to integrating various AI components and orchestrating the full power of Azure AI Services to build sophisticated, cross-modal solutions. By the end, you'll be equipped to design the next generation of intelligent, multi-faceted AI applications.

Programme

Intégration des composants d'IA multimodale

Ce module introduit les concepts fondamentaux de l'IA multimodale. Vous apprendrez les modèles architecturaux pour combiner différents composants d'IA, tels que les modèles de texte et d'image, et passerez d'une intégration de base à la création de systèmes complexes capables de raisonner à travers plusieurs types de données.

Génération d'images à partir de texte

Ce module propose une plongée approfondie dans la tâche populaire et créative de génération d'images à partir de descriptions textuelles. Vous explorerez les modèles qui alimentent cette technologie, comme DALL·E, et apprendrez des techniques de sollicitation basiques et avancées pour concevoir et affiner des sorties visuelles spécifiques et de haute qualité.

Applications intermodales avec Azure AI Vision

Ce module se concentre sur la mise en œuvre pratique en utilisant un outil puissant et spécialisé. Vous exploiterez les fonctionnalités d'Azure AI Vision pour créer et optimiser des applications intermodales telles que la description d'images et la recherche visuelle. Vous apprendrez comment ce service unique peut analyser le contenu visuel pour générer des descriptions textuelles riches et extraire le texte intégré (OCR), fournissant les composants de base pour des solutions multimodales sophistiquées.

Intégration avancée de l'IA avec les services Azure

Ce module de synthèse repose sur votre expertise approfondie en Azure AI Vision. Vous apprendrez à intégrer vos applications de vision avec d'autres services puissants d'Azure AI, tels que le Langage et la Parole, pour créer des solutions complètes de bout en bout. L'accent sera mis sur l'orchestration de ces services distincts pour développer une application sophistiquée qui résout un problème commercial réel, démontrant votre capacité à concevoir et construire un système multimodal complet depuis le début.

Enseigné par

Microsoft

Matières

Artificial Intelligence

Ce que vous devez savoir avant Vous commencez

Intégrations d'IA multimodales et intermodales

19 hours 55 minutes

Not Specified

Paid Course

Aperçu

Programme

Enseigné par

Matières

Sessions de groupe d'étude sur les réseaux neuronaux pour l'IA - Wolfram U

Applications de l'IA pour la santé mentale et la pratique clinique

Créer des applications avec l'IA — De l'idée au produit fonctionnel

Comprendre et évaluer l'IA pour la santé mentale

Maîtriser l'Architecture des Données SAP

Introduction à la prédiction performative - Tutoriel 1

Ce que vous devez savoir avant
Vous commencez