Ce que vous devez savoir avant
de commencer
Débute 3 July 2025 16:35
Se termine 3 July 2025
Sesame AI et RVQs - L'architecture réseau derrière les modèles de discours viraux
Neural Breakdown with AVB
2765 Cours
19 minutes
Mise à niveau optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Mise à niveau optionnelle disponible
Aperçu
Joignez-vous à nous pour un voyage fascinant au cœur du modèle de discours conversationnel de Sesame. Découvrez comment le Mimi Encoder utilise la tokenisation RVQ partagée pour traiter efficacement les codes sémantiques et acoustiques.
Dévoilez le rôle du Transformer Autoregressif dans la facilitation d'interactions vocales fluides et naturelles. Cette session perspicace est présentée par YouTube, conçue pour les passionnés d'intelligence artificielle et de science informatique.
Programme
- Introduction aux modèles de parole conversationnels
- Architecture du modèle de parole conversationnelle Sesame
- Encodeur Mimi et tokenisation
- Quantification vectorielle résiduelle fractionnée (RVQ)
- Codes sémantiques et acoustiques
- Fondement des Transformers autorégressifs
- Applications de Sesame AI
- Mise en œuvre pratique et études de cas
Sujets
Informatique