Ce que vous devez savoir avant
Vous commencez
Débute 6 June 2026 14:04
Se termine 6 June 2026
Sesame AI et RVQs - L'architecture réseau derrière les modèles de discours viraux
Neural Breakdown with AVB
6076 Cours
19 minutes
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Amélioration optionnelle disponible
Aperçu
Join us on a fascinating journey into the inner workings of the Sesame Conversational Speech Model. Discover how the Mimi Encoder utilizes split RVQ tokenization to process semantic and acoustic codes efficiently.
Uncover the role of the Autoregressive Transformer Backbone in enabling seamless and natural speech interactions. This insightful session is brought to you by YouTube, tailored for enthusiasts in Artificial Intelligence and Computer Science.
Programme
- Introduction aux modèles de parole conversationnels
- Architecture du modèle de parole conversationnelle Sesame
- Encodeur Mimi et tokenisation
- Quantification vectorielle résiduelle fractionnée (RVQ)
- Codes sémantiques et acoustiques
- Fondement des Transformers autorégressifs
- Applications de Sesame AI
- Mise en œuvre pratique et études de cas
Matières
Computer Science