Ce que vous devez savoir avant
Vous commencez

Débute 5 June 2026 13:08

Se termine 5 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Systèmes d'IA pour la Vision et l'Audio

Maîtrisez les systèmes d'IA prêts pour la production qui unifient les données visuelles et audio grâce à des techniques multimodales avancées, des pipelines ETL, des algorithmes de fusion et de l'ajustement fin de transformateurs.
Coursera via Coursera

Coursera

2874 Cours


4 weeks, 10 hours a week

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Build production-ready AI systems that process and unify visual and audio data through advanced multimodal techniques. This specialization equips you with comprehensive skills spanning image preprocessing, motion feature extraction, audio signal processing, cross-modal retrieval, and neural network debugging.

You'll learn to design automated ETL pipelines for multimodal data, implement fusion algorithms, validate data quality across modalities, fine-tune transformer-based models using transfer learning, and systematically diagnose model failures to optimize performance in real-world deployment scenarios.

Programme

  • Cours 1 : Affiner les modèles multimodaux avec l'apprentissage par transfert
  • Cours 2 : Évaluer les erreurs de vision : identifier les schémas d'échec

Enseigné par

Hurix Digital


Matières

Artificial Intelligence