Ce que vous devez savoir avant
Vous commencez

Débute 6 June 2026 14:04

Se termine 6 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Sesame AI et RVQs - L'architecture réseau derrière les modèles de discours viraux

Joignez-vous à nous pour un voyage fascinant au cœur du modèle de discours conversationnel de Sesame. Découvrez comment le Mimi Encoder utilise la tokenisation RVQ partagée pour traiter efficacement les codes sémantiques et acoustiques. Dévoilez le rôle du Transformer Autoregressif dans la facilitation d'interactions vocales fluides et naturel.
Neural Breakdown with AVB via YouTube

Neural Breakdown with AVB

6076 Cours


19 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Join us on a fascinating journey into the inner workings of the Sesame Conversational Speech Model. Discover how the Mimi Encoder utilizes split RVQ tokenization to process semantic and acoustic codes efficiently.

Uncover the role of the Autoregressive Transformer Backbone in enabling seamless and natural speech interactions. This insightful session is brought to you by YouTube, tailored for enthusiasts in Artificial Intelligence and Computer Science.

Programme

  • Introduction aux modèles de parole conversationnels
  • Aperçu de l'IA conversationnelle
    Importance des modèles de parole dans l'IA moderne
  • Architecture du modèle de parole conversationnelle Sesame
  • Structure générale et fonctionnalité
    Aperçu des composants clés
  • Encodeur Mimi et tokenisation
  • Concept de l'encodeur Mimi
    Processus de tokenisation
    Avantages de l'encodage Mimi
  • Quantification vectorielle résiduelle fractionnée (RVQ)
  • Fondamentaux du RVQ
    Technique de RVQ fractionnée
    Rôle dans le modèle de parole
  • Codes sémantiques et acoustiques
  • Explication des codes sémantiques
    Explication des codes acoustiques
    Intégration dans le modèle
  • Fondement des Transformers autorégressifs
  • Aperçu des modèles autorégressifs
    Architecture des Transformers dans les modèles de parole
    Avantages pour l'interaction naturelle de la parole
  • Applications de Sesame AI
  • Cas d'utilisation réels
    Tendances futures et opportunités
  • Mise en œuvre pratique et études de cas
  • Sessions pratiques
    Analyse des cas d'utilisation réussis

Matières

Computer Science