Ce que vous devez savoir avant
Vous commencez
Débute 6 June 2026 09:15
Se termine 6 June 2026
Mise à l'échelle à 0 de l'inférence LLM : Déploiement de modèle ouvert rentable sur des GPU sans serveur
Devoxx
6076 Cours
17 minutes
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Amélioration optionnelle disponible
Aperçu
Discover the innovative approach to deploying LLM models on serverless GPUs that scale efficiently to zero during inactivity. This session will guide you through the process of running Ollama on these advanced infrastructures, allowing for cost-effective open LLM deployment.
Gain complete control over both models and private data, optimizing performance and expenditure.
Programme
- **Introduction à l'informatique GPU sans serveur**
- **Aperçu d'Ollama et du déploiement de LLM**
- **Mise en place d'un environnement sans serveur**
- **Déploiement de LLM sur des GPU sans serveur**
- **Stratégies d'optimisation des coûts**
- **Maintien de la confidentialité des modèles et des données**
- **Optimisation des performances**
- **Dépannage et support**
- **Projet de fin d'études**
- **Conclusion du cours et orientations futures**
Matières
Computer Science