Ce que vous devez savoir avant
Vous commencez

Débute 5 July 2026 15:55

Se termine 5 July 2026

00 Jours

00 Heures

00 Minutes

00 Secondes

S'inscrire

Incitation multimodale : combiner texte, images, audio et vidéo

Maîtrisez l'incitation de l'IA multimodale en combinant texte, images et audio—aucun codage requis. Construisez des flux de travail pratiques, augmentez la productivité et créez des résultats plus solides grâce à des tâches réelles et des activités pratiques.

via Coursera

5 weeks, 1 hour a week

Amélioration optionnelle disponible

Débutant

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Learn how to get better, more useful results from modern multimodal AI tools using text, images, and audio—without needing any coding experience. You’ll start by understanding what multimodal AI is, how it differs from text‑only chatbots, and when to use text, image, or audio inputs for everyday tasks.

You’ll also set up a simple multimodal workspace using common tools so you can immediately apply what you learn. Through hands‑on, step‑by‑step activities, you’ll practice prompting with images to extract text, interpret diagrams or whiteboards, and troubleshoot common image‑related issues by adding context, constraints, and better visuals.

You’ll then explore audio and voice‑to‑text prompting to quickly capture ideas, turn spoken thoughts into structured outlines, and analyze meeting recordings for transcripts, summaries, and action items. Finally, you’ll connect all three modalities—text, image, and audio—into practical workflows, such as turning a hand‑drawn sketch and spoken brief into a structured plan, or using screenshots and transcripts to summarize video content.

You’ll finish the course with a simulated client scenario, a final assessment, and a clear set of next steps for continuing to build your multimodal prompting skills.

Programme

Introduction à l'IA multimodale

Dans ce module, vous explorerez les principes fondamentaux de l'IA multimodale et découvrirez comment la combinaison de texte, d'images et d'audio peut améliorer l'utilité de l'IA dans le travail quotidien. Vous apprendrez pourquoi la saisie uniquement textuelle est souvent insuffisante, verrez des exemples pratiques où d'autres modalités ajoutent de la valeur, et commencerez à configurer votre espace de travail avec des outils courants. Cette base vous aidera à choisir les modalités de manière intentionnelle et à travailler en toute confiance avec des systèmes multimodaux.

Maîtriser les entrées d'image (Vision)

Ce module se concentre sur l'utilisation d'images en tant que prompts pour aider l'IA à extraire, organiser et interpréter des informations visuelles. Vous apprendrez comment l'IA traite les photos, captures d'écran, tableaux blancs et notes, et pratiquerez l'application du prompt d'image à des tâches réelles telles que la numérisation de contenu et le diagnostic de problèmes visuels. Vous découvrirez également les limites courantes et comment améliorer les résultats avec des images plus claires, un contexte plus solide et des contraintes précises.

Parler et écouter (Audio)

Dans ce module, vous verrez comment l'audio peut rendre les interactions avec l'IA plus rapides, plus naturelles et plus utiles dans le cadre du travail réel. Vous explorerez la saisie vocale pour le remue-méninges et l'utilisation mobile, et apprendrez comment la transcription et le résumé peuvent accroître la productivité des réunions. Des habitudes pratiques pour une meilleure saisie vocale et l'examen des transcriptions vous aideront à tirer le meilleur parti des prompts audio.

Combinaison de modalités (Texte + Image + Audio)

Ce module réunit les prompts multimodaux dans des flux de travail pratiques qui reflètent comment l'IA est utilisée dans la conception, le conseil et le travail de connaissance. Vous apprendrez comment une entrée peut ancrer une tâche tandis qu'une autre fournit le contexte ou l'affinement, et pratiquerez l'application de ces modèles à des croquis, des matériaux vidéo et des travaux simulés de clients. Cela vous donnera une vision réaliste de la manière dont les systèmes multimodaux soutiennent une analyse plus riche et des résultats plus solides.

Conclusion du cours & prochaines étapes

Dans ce module final, vous consoliderez vos apprentissages et vous préparerez à continuer d'utiliser l'IA multimodale au-delà du cours. Vous passerez en revue les erreurs courantes, apprendrez comment choisir efficacement les outils et les modalités, et identifierez les prochaines étapes pour une pratique continue. Le module se termine par une évaluation finale pour confirmer votre compréhension et vous aider à développer une stratégie pratique pour le travail multimodal futur.

Enseigné par

Anton Voroniuk

Matières

Artificial Intelligence

Ce que vous devez savoir avant Vous commencez

Incitation multimodale : combiner texte, images, audio et vidéo

5 weeks, 1 hour a week

Débutant

Paid Course

Aperçu

Programme

Enseigné par

Matières

Faire Progresser Votre Carrière dans l'IA de Production

Bioproduction industrielle : des cellules aux produits

Automatiser les processus fiscaux de routine

Construire des agents d'IA multimodaux

Algorithmes mathématiques dans l'intelligence artificielle

Algorithme mathématique dans l'IA

Ce que vous devez savoir avant
Vous commencez