Qué necesitas saber antes de
comenzar

Inicio 6 June 2026 13:49

Fin 6 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Sesame AI y RVQs - La Arquitectura de Red Detrás de los Modelos de Habla Virales

Acompáñanos en un viaje fascinante por el funcionamiento interno del Modelo de Habla Conversacional Sesame. Descubre cómo el Codificador Mimi utiliza la tokenización RVQ dividida para procesar códigos semánticos y acústicos de manera eficiente. Revela el papel del Espinazo Transformador Autoregresivo en permitir interacciones de habla naturale.
Neural Breakdown with AVB via YouTube

Neural Breakdown with AVB

6076 Cursos


19 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Join us on a fascinating journey into the inner workings of the Sesame Conversational Speech Model. Discover how the Mimi Encoder utilizes split RVQ tokenization to process semantic and acoustic codes efficiently.

Uncover the role of the Autoregressive Transformer Backbone in enabling seamless and natural speech interactions. This insightful session is brought to you by YouTube, tailored for enthusiasts in Artificial Intelligence and Computer Science.

Programa

  • Introducción a los Modelos de Habla Conversacional
  • Visión General de la IA Conversacional
    Importancia de los Modelos de Habla en la IA Moderna
  • Arquitectura del Modelo de Habla Conversacional Sesame
  • Estructura General y Funcionalidad
    Descripción General de Componentes Clave
  • Codificador Mimi y Tokenización
  • Concepto del Codificador Mimi
    Proceso de Tokenización
    Ventajas de la Codificación Mimi
  • Cuantificación Vectorial Residual Dividida (RVQ)
  • Fundamentos de la RVQ
    Técnica de RVQ Dividida
    Papel en el Modelo de Habla
  • Códigos Semánticos y Acústicos
  • Explicación de los Códigos Semánticos
    Explicación de los Códigos Acústicos
    Integración dentro del Modelo
  • Estructura Autoregresiva del Transformer
  • Visión General de Modelos Autoregresivos
    Arquitectura del Transformer en Modelos de Habla
    Beneficios para la Interacción de Habla Natural
  • Aplicaciones de Sesame AI
  • Casos de Uso en el Mundo Real
    Tendencias Futuras y Oportunidades
  • Implementación Práctica y Estudios de Caso
  • Sesiones Prácticas
    Análisis de Casos de Éxito

Materias

Computer Science