Ce que vous devez savoir avant
de commencer

Débute 3 July 2025 16:35

Se termine 3 July 2025

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Sesame AI et RVQs - L'architecture réseau derrière les modèles de discours viraux

Joignez-vous à nous pour un voyage fascinant au cœur du modèle de discours conversationnel de Sesame. Découvrez comment le Mimi Encoder utilise la tokenisation RVQ partagée pour traiter efficacement les codes sémantiques et acoustiques. Dévoilez le rôle du Transformer Autoregressif dans la facilitation d'interactions vocales fluides et naturel.
Neural Breakdown with AVB via YouTube

Neural Breakdown with AVB

2765 Cours


19 minutes

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Joignez-vous à nous pour un voyage fascinant au cœur du modèle de discours conversationnel de Sesame. Découvrez comment le Mimi Encoder utilise la tokenisation RVQ partagée pour traiter efficacement les codes sémantiques et acoustiques.

Dévoilez le rôle du Transformer Autoregressif dans la facilitation d'interactions vocales fluides et naturelles. Cette session perspicace est présentée par YouTube, conçue pour les passionnés d'intelligence artificielle et de science informatique.

Programme

  • Introduction aux modèles de parole conversationnels
  • Aperçu de l'IA conversationnelle
    Importance des modèles de parole dans l'IA moderne
  • Architecture du modèle de parole conversationnelle Sesame
  • Structure générale et fonctionnalité
    Aperçu des composants clés
  • Encodeur Mimi et tokenisation
  • Concept de l'encodeur Mimi
    Processus de tokenisation
    Avantages de l'encodage Mimi
  • Quantification vectorielle résiduelle fractionnée (RVQ)
  • Fondamentaux du RVQ
    Technique de RVQ fractionnée
    Rôle dans le modèle de parole
  • Codes sémantiques et acoustiques
  • Explication des codes sémantiques
    Explication des codes acoustiques
    Intégration dans le modèle
  • Fondement des Transformers autorégressifs
  • Aperçu des modèles autorégressifs
    Architecture des Transformers dans les modèles de parole
    Avantages pour l'interaction naturelle de la parole
  • Applications de Sesame AI
  • Cas d'utilisation réels
    Tendances futures et opportunités
  • Mise en œuvre pratique et études de cas
  • Sessions pratiques
    Analyse des cas d'utilisation réussis

Sujets

Informatique