Ce que vous devez savoir avant
Vous commencez

Débute 11 June 2026 10:30

Se termine 11 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Incitation multimodale : combiner texte, images, audio et vidéo

Maîtrisez l'incitation de l'IA multimodale en combinant texte, images et audio—aucun codage requis. Construisez des flux de travail pratiques, augmentez la productivité et créez des résultats plus solides grâce à des tâches réelles et des activités pratiques.
via Coursera

2893 Cours


5 weeks, 1 hour a week

Amélioration optionnelle disponible

Débutant

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Learn how to get better, more useful results from modern multimodal AI tools using text, images, and audio—without needing any coding experience. You’ll start by understanding what multimodal AI is, how it differs from text‑only chatbots, and when to use text, image, or audio inputs for everyday tasks.

You’ll also set up a simple multimodal workspace using common tools so you can immediately apply what you learn. Through hands‑on, step‑by‑step activities, you’ll practice prompting with images to extract text, interpret diagrams or whiteboards, and troubleshoot common image‑related issues by adding context, constraints, and better visuals.

You’ll then explore audio and voice‑to‑text prompting to quickly capture ideas, turn spoken thoughts into structured outlines, and analyze meeting recordings for transcripts, summaries, and action items. Finally, you’ll connect all three modalities—text, image, and audio—into practical workflows, such as turning a hand‑drawn sketch and spoken brief into a structured plan, or using screenshots and transcripts to summarize video content.

You’ll finish the course with a simulated client scenario, a final assessment, and a clear set of next steps for continuing to build your multimodal prompting skills.

Programme

  • Introduction à l'IA multimodale
  • Dans ce module, vous explorerez les principes fondamentaux de l'IA multimodale et découvrirez comment la combinaison de texte, d'images et d'audio peut améliorer l'utilité de l'IA dans le travail quotidien. Vous apprendrez pourquoi la saisie uniquement textuelle est souvent insuffisante, verrez des exemples pratiques où d'autres modalités ajoutent de la valeur, et commencerez à configurer votre espace de travail avec des outils courants. Cette base vous aidera à choisir les modalités de manière intentionnelle et à travailler en toute confiance avec des systèmes multimodaux.
  • Maîtriser les entrées d'image (Vision)
  • Ce module se concentre sur l'utilisation d'images en tant que prompts pour aider l'IA à extraire, organiser et interpréter des informations visuelles. Vous apprendrez comment l'IA traite les photos, captures d'écran, tableaux blancs et notes, et pratiquerez l'application du prompt d'image à des tâches réelles telles que la numérisation de contenu et le diagnostic de problèmes visuels. Vous découvrirez également les limites courantes et comment améliorer les résultats avec des images plus claires, un contexte plus solide et des contraintes précises.
  • Parler et écouter (Audio)
  • Dans ce module, vous verrez comment l'audio peut rendre les interactions avec l'IA plus rapides, plus naturelles et plus utiles dans le cadre du travail réel. Vous explorerez la saisie vocale pour le remue-méninges et l'utilisation mobile, et apprendrez comment la transcription et le résumé peuvent accroître la productivité des réunions. Des habitudes pratiques pour une meilleure saisie vocale et l'examen des transcriptions vous aideront à tirer le meilleur parti des prompts audio.
  • Combinaison de modalités (Texte + Image + Audio)
  • Ce module réunit les prompts multimodaux dans des flux de travail pratiques qui reflètent comment l'IA est utilisée dans la conception, le conseil et le travail de connaissance. Vous apprendrez comment une entrée peut ancrer une tâche tandis qu'une autre fournit le contexte ou l'affinement, et pratiquerez l'application de ces modèles à des croquis, des matériaux vidéo et des travaux simulés de clients. Cela vous donnera une vision réaliste de la manière dont les systèmes multimodaux soutiennent une analyse plus riche et des résultats plus solides.
  • Conclusion du cours & prochaines étapes
  • Dans ce module final, vous consoliderez vos apprentissages et vous préparerez à continuer d'utiliser l'IA multimodale au-delà du cours. Vous passerez en revue les erreurs courantes, apprendrez comment choisir efficacement les outils et les modalités, et identifierez les prochaines étapes pour une pratique continue. Le module se termine par une évaluation finale pour confirmer votre compréhension et vous aider à développer une stratégie pratique pour le travail multimodal futur.

Enseigné par

Anton Voroniuk


Matières

Artificial Intelligence