Lo que necesitas saber antes de
que comiences
Comienza 3 July 2025 16:38
Termina 3 July 2025
Sesame AI y RVQs - La Arquitectura de Red Detrás de los Modelos de Habla Virales
Neural Breakdown with AVB
2765 Cursos
19 minutes
Actualización opcional disponible
Not Specified
Progreso a tu propio ritmo
Free Video
Actualización opcional disponible
Resumen
Acompáñanos en un viaje fascinante por el funcionamiento interno del Modelo de Habla Conversacional Sesame. Descubre cómo el Codificador Mimi utiliza la tokenización RVQ dividida para procesar códigos semánticos y acústicos de manera eficiente.
Revela el papel del Espinazo Transformador Autoregresivo en permitir interacciones de habla naturales y fluidas. Esta sesión perspicaz es presentada por YouTube, y está diseñada para entusiastas de la Inteligencia Artificial y Ciencias de la Computación.
Programa de estudio
- Introducción a los Modelos de Habla Conversacional
- Arquitectura del Modelo de Habla Conversacional Sesame
- Codificador Mimi y Tokenización
- Cuantificación Vectorial Residual Dividida (RVQ)
- Códigos Semánticos y Acústicos
- Estructura Autoregresiva del Transformer
- Aplicaciones de Sesame AI
- Implementación Práctica y Estudios de Caso
Asignaturas
Ciencias de la Computación