Ce que vous devez savoir avant
de commencer

Débute 3 July 2025 16:35

Se termine 3 July 2025

00 Jours

00 Heures

00 Minutes

00 Secondes

Sesame AI et RVQs - L'architecture réseau derrière les modèles de discours viraux

Joignez-vous à nous pour un voyage fascinant au cœur du modèle de discours conversationnel de Sesame. Découvrez comment le Mimi Encoder utilise la tokenisation RVQ partagée pour traiter efficacement les codes sémantiques et acoustiques. Dévoilez le rôle du Transformer Autoregressif dans la facilitation d'interactions vocales fluides et naturel.

Neural Breakdown with AVB via YouTube

19 minutes

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Dévoilez le rôle du Transformer Autoregressif dans la facilitation d'interactions vocales fluides et naturelles. Cette session perspicace est présentée par YouTube, conçue pour les passionnés d'intelligence artificielle et de science informatique.

Programme

Introduction aux modèles de parole conversationnels

Aperçu de l'IA conversationnelle

Importance des modèles de parole dans l'IA moderne

Architecture du modèle de parole conversationnelle Sesame

Structure générale et fonctionnalité

Aperçu des composants clés

Encodeur Mimi et tokenisation

Concept de l'encodeur Mimi

Processus de tokenisation

Avantages de l'encodage Mimi

Quantification vectorielle résiduelle fractionnée (RVQ)

Fondamentaux du RVQ

Technique de RVQ fractionnée

Rôle dans le modèle de parole

Codes sémantiques et acoustiques

Explication des codes sémantiques

Explication des codes acoustiques

Intégration dans le modèle

Fondement des Transformers autorégressifs

Aperçu des modèles autorégressifs

Architecture des Transformers dans les modèles de parole

Avantages pour l'interaction naturelle de la parole

Applications de Sesame AI

Cas d'utilisation réels

Tendances futures et opportunités

Mise en œuvre pratique et études de cas

Sessions pratiques

Analyse des cas d'utilisation réussis

Sujets

Informatique

Ce que vous devez savoir avant de commencer

Sesame AI et RVQs - L'architecture réseau derrière les modèles de discours viraux

19 minutes

Not Specified

Free Video

Aperçu

Programme

Sujets

Déverrouiller la sécurité à grande échelle - Comment les fournisseurs de renseignements sur les menaces et les réseaux cloud collaborent

Chaque emploi en cybersécurité expliqué

Cultiver la compassion et la pensée systémique pour transformer la médecine

Démontrer les capacités de Microsoft Power Automate

Démontrer les capacités de Microsoft Power Apps

Démontrer les capacités de Microsoft Power Pages

Ce que vous devez savoir avant
de commencer