Lo que necesitas saber antes de
que comiences
Comienza 29 June 2025 06:51
Termina 29 June 2025
Dando Visión a los Modelos de Voz
Massachusetts Institute of Technology
5 Cursos
The Massachusetts Institute of Technology (MIT) is a globally recognized research university known for its interdisciplinary curriculum, pioneering research, and groundbreaking discoveries.
24 minutes
Actualización opcional disponible
Not Specified
Progreso a tu propio ritmo
Free Video
Actualización opcional disponible
Resumen
Descubre la innovadora integración de las características visuales de los labios en modelos de reconocimiento de voz a través de Whisper-Flamingo, un enfoque innovador que mejora significativamente el rendimiento en entornos desafiantes y ruidosos. Este avance no solo mejora el reconocimiento de voz en inglés, sino que también ofrece capacidades superiores de traducción multilingüe.
Únete a esta fascinante exploración presentada por el renombrado Instituto Tecnológico de Massachusetts, disponible en YouTube.
Mejora tu comprensión del moderno reconocimiento de voz y la inteligencia artificial adentrándote en este desarrollo fascinante dentro de los campos de la IA y la ciencia de la computación.
Programa de estudio
- **Introducción a Whisper-Flamingo**
- **Fundamentos del Reconocimiento de Voz**
- **Introducción a las Características Visuales de los Labios**
- **Integración de Datos Visuales y de Audio**
- **Mejora del Desempeño en Condiciones Ruidosas**
- **Reconocimiento de Voz en Inglés**
- **Traducción Multilingüe con Whisper-Flamingo**
- **Evaluación del Modelo y Métricas de Desempeño**
- **Temas Avanzados y Direcciones Futuras**
- **Proyecto e Implementación Práctica**
- **Cierre del Curso y Próximos Pasos**
Asignaturas
Ciencias de la Computación