Ce que vous devez savoir avant
Vous commencez
Débute 5 June 2026 13:08
Se termine 5 June 2026
Systèmes d'IA pour la Vision et l'Audio
Coursera
2874 Cours
4 weeks, 10 hours a week
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Paid Course
Amélioration optionnelle disponible
Aperçu
Build production-ready AI systems that process and unify visual and audio data through advanced multimodal techniques. This specialization equips you with comprehensive skills spanning image preprocessing, motion feature extraction, audio signal processing, cross-modal retrieval, and neural network debugging.
You'll learn to design automated ETL pipelines for multimodal data, implement fusion algorithms, validate data quality across modalities, fine-tune transformer-based models using transfer learning, and systematically diagnose model failures to optimize performance in real-world deployment scenarios.
Programme
- Cours 1 : Affiner les modèles multimodaux avec l'apprentissage par transfert
- Cours 2 : Évaluer les erreurs de vision : identifier les schémas d'échec
Enseigné par
Hurix Digital
Matières
Artificial Intelligence