Lo que necesitas saber antes de
que comiences

Comienza 3 July 2025 16:38

Termina 3 July 2025

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Sesame AI y RVQs - La Arquitectura de Red Detrás de los Modelos de Habla Virales

Acompáñanos en un viaje fascinante por el funcionamiento interno del Modelo de Habla Conversacional Sesame. Descubre cómo el Codificador Mimi utiliza la tokenización RVQ dividida para procesar códigos semánticos y acústicos de manera eficiente. Revela el papel del Espinazo Transformador Autoregresivo en permitir interacciones de habla naturale.
Neural Breakdown with AVB via YouTube

Neural Breakdown with AVB

2765 Cursos


19 minutes

Actualización opcional disponible

Not Specified

Progreso a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Acompáñanos en un viaje fascinante por el funcionamiento interno del Modelo de Habla Conversacional Sesame. Descubre cómo el Codificador Mimi utiliza la tokenización RVQ dividida para procesar códigos semánticos y acústicos de manera eficiente.

Revela el papel del Espinazo Transformador Autoregresivo en permitir interacciones de habla naturales y fluidas. Esta sesión perspicaz es presentada por YouTube, y está diseñada para entusiastas de la Inteligencia Artificial y Ciencias de la Computación.

Programa de estudio

  • Introducción a los Modelos de Habla Conversacional
  • Visión General de la IA Conversacional
    Importancia de los Modelos de Habla en la IA Moderna
  • Arquitectura del Modelo de Habla Conversacional Sesame
  • Estructura General y Funcionalidad
    Descripción General de Componentes Clave
  • Codificador Mimi y Tokenización
  • Concepto del Codificador Mimi
    Proceso de Tokenización
    Ventajas de la Codificación Mimi
  • Cuantificación Vectorial Residual Dividida (RVQ)
  • Fundamentos de la RVQ
    Técnica de RVQ Dividida
    Papel en el Modelo de Habla
  • Códigos Semánticos y Acústicos
  • Explicación de los Códigos Semánticos
    Explicación de los Códigos Acústicos
    Integración dentro del Modelo
  • Estructura Autoregresiva del Transformer
  • Visión General de Modelos Autoregresivos
    Arquitectura del Transformer en Modelos de Habla
    Beneficios para la Interacción de Habla Natural
  • Aplicaciones de Sesame AI
  • Casos de Uso en el Mundo Real
    Tendencias Futuras y Oportunidades
  • Implementación Práctica y Estudios de Caso
  • Sesiones Prácticas
    Análisis de Casos de Éxito

Asignaturas

Ciencias de la Computación