What You Need to Know Before
You Start
Starts 4 June 2025 14:42
Ends 4 June 2025
00
days
00
hours
00
minutes
00
seconds
IA y ML: El Aspecto Operativo Crítico de Ejecutar Aplicaciones en Kubernetes
Descubre cómo gestionar eficazmente las operaciones de IA y ML utilizando malla de servicios, centrándote en cargas de trabajo con GPU, multialquiler y escalado en entornos de Kubernetes para aplicaciones de ML confiables y observables.
CNCF [Cloud Native Computing Foundation]
via YouTube
CNCF [Cloud Native Computing Foundation]
2458 Cursos
28 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Descubre cómo gestionar eficazmente las operaciones de IA y ML utilizando malla de servicios, centrándote en cargas de trabajo con GPU, multialquiler y escalado en entornos de Kubernetes para aplicaciones de ML confiables y observables.
Programa de estudio
- Introducción a Kubernetes para AI/ML
- Comprensión de Cargas de Trabajo de AI y ML en Kubernetes
- Fundamentos de Service Mesh
- Gestión de Cargas de Trabajo de GPU con Kubernetes
- Multitenencia en Kubernetes
- Escalado de Aplicaciones AI/ML en Kubernetes
- Observabilidad y Monitoreo en Operaciones de AI/ML
- Estudios de Caso y Mejores Prácticas
- Resumen y Preguntas y Respuestas
Vista general de la arquitectura de Kubernetes
Conceptos clave: pods, nodos y clusters
Fundamentos de redes en Kubernetes
Características de las cargas de trabajo de AI/ML
Desafíos comunes al implementar AI/ML en Kubernetes
Introducción al uso de GPU en Kubernetes
Definición y beneficios de un service mesh
Panorama de tecnologías populares de service mesh (Istio, Linkerd, etc.)
Implementación de un service mesh en Kubernetes para aplicaciones de AI/ML
Configuración de Kubernetes para el suministro de GPU
Mejores prácticas para la gestión de recursos de GPU
Herramientas y marcos para optimizar el rendimiento de cargas de trabajo de GPU
Enfoques para lograr la multitenencia
Gestión de namespaces y cuotas de recursos
Consideraciones de seguridad en entornos multietapa
Autoscalado horizontal y vertical de pods
Estrategias de balanceo de carga y resiliencia
Manejo de cargas de trabajo con y sin estado
Configuración de monitoreo para aplicaciones basadas en Kubernetes
Uso de herramientas como Prometheus y Grafana
Implementación de registro y trazabilidad
Ejemplos del mundo real de despliegues de AI/ML en Kubernetes
Lecciones aprendidas y mejores prácticas de la industria
Conclusiones clave del curso
Espacio abierto para preguntas y aclaraciones
Asignaturas
Programación