Ce que vous devez savoir avant
de commencer
Débute 7 July 2025 07:34
Se termine 7 July 2025
Surveillance des GPU à grande échelle pour les clusters IA - ML et HPC
CNCF [Cloud Native Computing Foundation]
2891 Cours
36 minutes
Mise à niveau optionnelle disponible
Not Specified
Progressez à votre rythme
Conference Talk
Mise à niveau optionnelle disponible
Aperçu
Rejoignez-nous alors que nous examinons comment NVIDIA surveille efficacement les clusters GPU adaptés aux charges de travail en intelligence artificielle et apprentissage automatique. Cette session complète vous guidera à travers l'application d'outils open-source pour aborder les principaux défis de déploiement, de maintenance, de sécurité et de mise à l'échelle dans des environnements utilisateurs hétérogènes.
Programme
- Introduction à la surveillance des GPU
- Compréhension des architectures GPU et des indicateurs de performance
- Outils pour la surveillance des GPU NVIDIA
- Déploiement de solutions de surveillance à grande échelle
- Maintenance et mises à jour
- Considérations de sécurité dans la surveillance des GPU
- Évolutivité des solutions de surveillance des GPU
- Prise en compte des utilisateurs dans la surveillance des GPU
- Études de cas et exemples du monde réel
- Exercices pratiques et sessions de laboratoire
- Conclusion et tendances futures
- Questions et Réponses et clôture du cours
Sujets
Conférences