Ce que vous devez savoir avant
de commencer

Débute 7 July 2025 07:24

Se termine 7 July 2025

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Mise à l'échelle de l'inférence GenAI - Techniques, optimisations et leçons du monde réel

Découvrez des techniques avancées pour évoluer l'inférence GenAI, y compris le regroupement, la quantification, le parallélisme et la gestion du cache KV, afin de réduire la latence et les coûts dans les systèmes de production.
Weights & Biases via YouTube

Weights & Biases

2891 Cours


16 minutes

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Découvrez des techniques avancées pour évoluer l'inférence GenAI, y compris le regroupement, la quantification, le parallélisme et la gestion du cache KV, afin de réduire la latence et les coûts dans les systèmes de production.


Sujets

Informatique