Lo que necesitas saber antes de
que comiences

Comienza 7 July 2025 07:23

Termina 7 July 2025

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Escalando la Inferencia GenAI: Técnicas, Optimizaciones y Lecciones del Mundo Real

Descubre técnicas avanzadas para escalar la inferencia de GenAI, incluyendo batching, cuantización, paralelismo y gestión del caché KV para reducir la latencia y los costos en sistemas de producción.
Weights & Biases via YouTube

Weights & Biases

2891 Cursos


16 minutes

Actualización opcional disponible

Not Specified

Progreso a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Descubre técnicas avanzadas para escalar la inferencia de GenAI, incluyendo batching, cuantización, paralelismo y gestión del caché KV para reducir la latencia y los costos en sistemas de producción.


Asignaturas

Ciencias de la Computación