Qué necesitas saber antes de
comenzar
Inicio 6 June 2026 13:49
Fin 6 June 2026
Sesame AI y RVQs - La Arquitectura de Red Detrás de los Modelos de Habla Virales
Neural Breakdown with AVB
6076 Cursos
19 minutes
Actualización opcional disponible
Not Specified
Avanza a tu propio ritmo
Free Video
Actualización opcional disponible
Resumen
Join us on a fascinating journey into the inner workings of the Sesame Conversational Speech Model. Discover how the Mimi Encoder utilizes split RVQ tokenization to process semantic and acoustic codes efficiently.
Uncover the role of the Autoregressive Transformer Backbone in enabling seamless and natural speech interactions. This insightful session is brought to you by YouTube, tailored for enthusiasts in Artificial Intelligence and Computer Science.
Programa
- Introducción a los Modelos de Habla Conversacional
- Arquitectura del Modelo de Habla Conversacional Sesame
- Codificador Mimi y Tokenización
- Cuantificación Vectorial Residual Dividida (RVQ)
- Códigos Semánticos y Acústicos
- Estructura Autoregresiva del Transformer
- Aplicaciones de Sesame AI
- Implementación Práctica y Estudios de Caso
Materias
Computer Science