Qué necesitas saber antes de
comenzar
Inicio 4 June 2026 07:31
Fin 4 June 2026
Monitoreo de GPUs a Escala para Clústeres de IA - ML y HPC
CNCF [Cloud Native Computing Foundation]
6076 Cursos
36 minutes
Actualización opcional disponible
Not Specified
Avanza a tu propio ritmo
Conference Talk
Actualización opcional disponible
Resumen
Learn how NVIDIA monitors GPU clusters for AI/ML workloads using open-source tools, addressing deployment, maintenance, security, and scale challenges for various user personas.
Programa
- Introducción al Monitoreo de GPU
- Comprensión de Arquitecturas de GPU y Métricas de Rendimiento
- Herramientas para Monitorear GPUs de NVIDIA
- Implementación de Soluciones de Monitoreo a Gran Escala
- Mantenimiento y Actualizaciones
- Consideraciones de Seguridad en el Monitoreo de GPU
- Escalabilidad de Soluciones de Monitoreo de GPU
- Abordando los Perfiles de Usuario en el Monitoreo de GPU
- Estudios de Caso y Ejemplos del Mundo Real
- Ejercicios Prácticos y Sesiones de Laboratorio
- Conclusión y Tendencias Futuras
- Preguntas y Resumen del Curso
Materias
Conference Talks