Ce que vous devez savoir avant
de commencer
Débute 29 June 2025 12:32
Se termine 29 June 2025
Donner la vue aux modèles de parole
Massachusetts Institute of Technology
5 Cours
The Massachusetts Institute of Technology (MIT) is a globally recognized research university known for its interdisciplinary curriculum, pioneering research, and groundbreaking discoveries.
24 minutes
Mise à niveau optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Mise à niveau optionnelle disponible
Aperçu
Découvrez l'intégration révolutionnaire des caractéristiques visuelles des lèvres dans les modèles de reconnaissance vocale grâce à Whisper-Flamingo, une approche innovante qui améliore considérablement les performances dans des environnements difficiles et bruyants. Cette avancée améliore non seulement la reconnaissance vocale en anglais mais offre également des capacités de traduction multilingues supérieures.
Rejoignez cette exploration fascinante présentée par le renommé Massachusetts Institute of Technology, disponible sur YouTube.
Approfondissez votre compréhension de la reconnaissance vocale moderne et de l'intelligence artificielle en vous plongeant dans ce développement captivant dans les domaines de l'IA et de l'informatique.
Programme
- **Introduction à Whisper-Flamingo**
- **Fondamentaux de la Reconnaissance Vocale**
- **Introduction aux Caractéristiques Visuelles des Lèvres**
- **Intégration des Données Visuelles et Audio**
- **Amélioration des Performances dans des Conditions Bruyantes**
- **Reconnaissance Vocale de la Langue Anglaise**
- **Traduction Multilingue avec Whisper-Flamingo**
- **Évaluation du Modèle et Mesures de Performance**
- **Sujets Avancés et Directions Futures**
- **Projet et Mise en Œuvre Pratique**
- **Conclusion du Cours et Prochaines Étapes**
Sujets
Informatique