Qué necesitas saber antes de
comenzar
Inicio 6 June 2026 09:15
Fin 6 June 2026
Escalar a 0 la Inferencia de Modelos de Lenguaje: Despliegue de Modelos Abiertos Rentable en GPUs Sin Servidor
Devoxx
6076 Cursos
17 minutes
Actualización opcional disponible
Not Specified
Avanza a tu propio ritmo
Free Video
Actualización opcional disponible
Resumen
Discover the innovative approach to deploying LLM models on serverless GPUs that scale efficiently to zero during inactivity. This session will guide you through the process of running Ollama on these advanced infrastructures, allowing for cost-effective open LLM deployment.
Gain complete control over both models and private data, optimizing performance and expenditure.
Programa
- **Introducción a la Computación sin Servidor con GPU**
- **Visión General de Ollama y Despliegue de LLM**
- **Configuración de un Entorno Sin Servidor**
- **Despliegue de LLMs en GPUs Sin Servidor**
- **Estrategias de Optimización de Costos**
- **Mantenimiento de la Privacidad del Modelo y los Datos**
- **Optimización del Rendimiento**
- **Solución de Problemas y Soporte**
- **Proyecto Final**
- **Conclusión del Curso y Direcciones Futuras**
Materias
Computer Science