Qué necesitas saber antes de
comenzar

Inicio 4 June 2026 17:19

Fin 4 June 2026

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Proyección del Rendimiento de Inferencia de LLM

Adéntrate en las complejidades de la inferencia de IA con MESA, una herramienta sofisticada creada para proyectar y analizar el rendimiento de modelos de lenguaje de gran envergadura (LLMs) en una variedad de hardware y arquitecturas de modelos. Este recurso de evaluación ofrece desgloses detallados de procesos operacionales y análisis en pr.
Open Compute Project via YouTube

Open Compute Project

6076 Cursos


15 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Delve into the intricacies of AI inference with MESA, a sophisticated tool created to project and scrutinize the performance of large language models (LLMs) across a range of hardware and model architectures. This evaluation resource offers detailed breakdowns of operational processes and in-depth context length analyses.

Join us to enhance your understanding of how these AI systems perform and scale across different computational environments, brought to you by YouTube. Ideal for enthusiasts and professionals interested in artificial intelligence and computer science.

Programa

  • Introducción al Rendimiento de Inferencia de Modelos de Lenguaje de Gran Escala
  • Visión general de los modelos de lenguaje de gran escala (LLMs)
    Importancia de la proyección de rendimiento para aplicaciones de LLM
  • Introducción a MESA
  • ¿Qué es MESA?
    Características y capacidades de MESA
  • Configuración de MESA
  • Instalación y configuración
    Preparación del entorno para el análisis de inferencia
  • Evaluación del Rendimiento de LLM
  • Métricas clave para la evaluación del rendimiento
    Comparación de diferentes arquitecturas de LLM
  • Consideraciones de Hardware
  • Visión general de las opciones de hardware para la inferencia de LLM
    Análisis del rendimiento entre CPUs, GPUs y TPUs
  • Desglose de Operaciones
  • Comprensión de las operaciones del modelo
    Desglose de procesos de inferencia en MESA
  • Análisis de Longitud de Contexto
  • Impacto de la longitud del contexto en el rendimiento de inferencia
    Técnicas para optimizar la longitud del contexto en LLMs
  • Estudios de Caso
  • Ejemplos del mundo real utilizando MESA para la evaluación del rendimiento
    Lecciones aprendidas de diferentes estudios de caso
  • Tendencias Futuras en la Inferencia de LLM
  • Tecnologías emergentes y su impacto en la inferencia
    Predicciones sobre la futura dirección del análisis de rendimiento de LLM
  • Conclusión
  • Resumen de los aprendizajes clave
    Próximos pasos en la exploración y aplicación de MESA para la proyección de rendimiento

Materias

Computer Science