What You Need to Know Before
You Start
Starts 8 June 2025 05:10
Ends 8 June 2025
Dando Visión a los Modelos de Voz
Massachusetts Institute of Technology
5 Cursos
The Massachusetts Institute of Technology (MIT) is a globally recognized research university known for its interdisciplinary curriculum, pioneering research, and groundbreaking discoveries.
24 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Descubra cómo Whisper-Flamingo integra características visuales de los labios en los modelos de reconocimiento de voz, mejorando el rendimiento en condiciones ruidosas tanto para el reconocimiento en inglés como para la traducción multilingüe.
Programa de estudio
- **Introducción a Whisper-Flamingo**
- **Fundamentos del Reconocimiento de Voz**
- **Introducción a las Características Visuales de los Labios**
- **Integración de Datos Visuales y de Audio**
- **Mejora del Desempeño en Condiciones Ruidosas**
- **Reconocimiento de Voz en Inglés**
- **Traducción Multilingüe con Whisper-Flamingo**
- **Evaluación del Modelo y Métricas de Desempeño**
- **Temas Avanzados y Direcciones Futuras**
- **Proyecto e Implementación Práctica**
- **Cierre del Curso y Próximos Pasos**
Asignaturas
Ciencias de la Computación