What You Need to Know Before
You Start
Starts 8 June 2025 05:08
Ends 8 June 2025
Donner la vue aux modèles de parole
Massachusetts Institute of Technology
5 Cours
The Massachusetts Institute of Technology (MIT) is a globally recognized research university known for its interdisciplinary curriculum, pioneering research, and groundbreaking discoveries.
24 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Aperçu
Découvrez comment Whisper-Flamingo intègre des caractéristiques visuelles des lèvres dans les modèles de reconnaissance vocale, améliorant les performances dans des conditions bruyantes tant pour la reconnaissance de l'anglais que pour la traduction multilingue.
Programme
- **Introduction à Whisper-Flamingo**
- **Fondamentaux de la Reconnaissance Vocale**
- **Introduction aux Caractéristiques Visuelles des Lèvres**
- **Intégration des Données Visuelles et Audio**
- **Amélioration des Performances dans des Conditions Bruyantes**
- **Reconnaissance Vocale de la Langue Anglaise**
- **Traduction Multilingue avec Whisper-Flamingo**
- **Évaluation du Modèle et Mesures de Performance**
- **Sujets Avancés et Directions Futures**
- **Projet et Mise en Œuvre Pratique**
- **Conclusion du Cours et Prochaines Étapes**
Sujets
Informatique