Ce que vous devez savoir avant
Vous commencez
Débute 4 June 2026 13:24
Se termine 4 June 2026
Surveillance des GPU à grande échelle pour les clusters IA - ML et HPC
CNCF [Cloud Native Computing Foundation]
6076 Cours
36 minutes
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Conference Talk
Amélioration optionnelle disponible
Aperçu
Learn how NVIDIA monitors GPU clusters for AI/ML workloads using open-source tools, addressing deployment, maintenance, security, and scale challenges for various user personas.
Programme
- Introduction à la surveillance des GPU
- Compréhension des architectures GPU et des indicateurs de performance
- Outils pour la surveillance des GPU NVIDIA
- Déploiement de solutions de surveillance à grande échelle
- Maintenance et mises à jour
- Considérations de sécurité dans la surveillance des GPU
- Évolutivité des solutions de surveillance des GPU
- Prise en compte des utilisateurs dans la surveillance des GPU
- Études de cas et exemples du monde réel
- Exercices pratiques et sessions de laboratoire
- Conclusion et tendances futures
- Questions et Réponses et clôture du cours
Matières
Conference Talks