Ce que vous devez savoir avant
Vous commencez
Débute 4 June 2026 04:53
Se termine 4 June 2026
Donner la vue aux modèles de parole
Massachusetts Institute of Technology
5 Cours
L'Institut de Technologie du Massachusetts (MIT) est une université de recherche de renommée mondiale, célèbre pour son programme d'études interdisciplinaire, ses recherches innovantes et ses découvertes révolutionnaires.
24 minutes
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Amélioration optionnelle disponible
Aperçu
Discover the groundbreaking integration of visual lip features into speech recognition models through Whisper-Flamingo, an innovative approach that significantly enhances performance in challenging, noisy environments. This advancement not only improves English speech recognition but also offers superior multilingual translation capabilities.
Join this compelling exploration presented by the renowned Massachusetts Institute of Technology, available on YouTube.
Enhance your understanding of modern speech recognition and artificial intelligence by delving into this fascinating development within the fields of AI and computer science.
Programme
- **Introduction à Whisper-Flamingo**
- **Fondamentaux de la Reconnaissance Vocale**
- **Introduction aux Caractéristiques Visuelles des Lèvres**
- **Intégration des Données Visuelles et Audio**
- **Amélioration des Performances dans des Conditions Bruyantes**
- **Reconnaissance Vocale de la Langue Anglaise**
- **Traduction Multilingue avec Whisper-Flamingo**
- **Évaluation du Modèle et Mesures de Performance**
- **Sujets Avancés et Directions Futures**
- **Projet et Mise en Œuvre Pratique**
- **Conclusion du Cours et Prochaines Étapes**
Matières
Computer Science