Lo que necesitas saber antes de
que comiences
Comienza 7 July 2025 07:33
Termina 7 July 2025
Monitoreo de GPUs a Escala para Clústeres de IA - ML y HPC
CNCF [Cloud Native Computing Foundation]
2891 Cursos
36 minutes
Actualización opcional disponible
Not Specified
Progreso a tu propio ritmo
Conference Talk
Actualización opcional disponible
Resumen
Únete a nosotros mientras exploramos cómo NVIDIA monitorea efectivamente clústeres de GPU diseñados para cargas de trabajo de inteligencia artificial y aprendizaje automático. Esta sesión integral te guiará a través de la aplicación de herramientas de código abierto para enfrentar los principales desafíos de implementación, mantenimiento, seguridad y escalabilidad en entornos de usuario heterogéneos.
Programa de estudio
- Introducción al Monitoreo de GPU
- Comprensión de Arquitecturas de GPU y Métricas de Rendimiento
- Herramientas para Monitorear GPUs de NVIDIA
- Implementación de Soluciones de Monitoreo a Gran Escala
- Mantenimiento y Actualizaciones
- Consideraciones de Seguridad en el Monitoreo de GPU
- Escalabilidad de Soluciones de Monitoreo de GPU
- Abordando los Perfiles de Usuario en el Monitoreo de GPU
- Estudios de Caso y Ejemplos del Mundo Real
- Ejercicios Prácticos y Sesiones de Laboratorio
- Conclusión y Tendencias Futuras
- Preguntas y Resumen del Curso
Asignaturas
Charlas de Conferencia