Ce que vous devez savoir avant
Vous commencez

Débute 6 June 2026 18:02

Se termine 6 June 2026

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Techniques d'inférence pour le déploiement local et en cloud des LLM

Maîtrisez les techniques d'inférence LLM pour déployer des modèles Llama localement et dans le cloud, y compris la quantification, les pipelines de prompt et les applications évolutives dans le monde réel.
Meta via Coursera

Meta

2874 Cours


Not Specified

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Expand your AI development skills by learning to run Llama models on local machines and at scale in the cloud. Master the principles of LLM inference, apply quantization for efficiency, and design prompt pipelines for real-world tasks.

Through hands-on projects, you’ll deploy an LLM-enabled tool that demonstrates scalability, performance, and practical impact.

Programme

  • Introduction aux LLM (Modèles de Langage de Grande Taille)
  • Aperçu des modèles Llama
    Concepts clés des LLM : Paramètres, apprentissage, et inférence
  • Principes de l'Inférence des LLM
  • Comprendre l'inférence dans les modèles d'IA
    Différences entre apprentissage et inférence
    Défis de l'inférence des LLM
  • Déploiement Local des LLM
  • Mise en place d'un environnement local pour les LLM
    Exécution des modèles Llama sur des machines locales
    Optimisation des performances locales
  • Déploiement des LLM sur le Cloud
  • Introduction aux plateformes cloud pour l'IA
    Déployer les modèles Llama dans le cloud
    Gestion des ressources cloud pour la scalabilité
  • Efficacité de l'Inférence des LLM
  • Techniques pour l'optimisation des modèles
    Comprendre et appliquer la quantification
    Équilibrer précision et efficacité
  • Conception de Pipelines de Prompt
  • Introduction à l'ingénierie des prompts
    Construire et tester des pipelines de prompt
    Adapter les prompts pour diverses tâches
  • Projets Pratiques
  • Projet 1 : Déployer un modèle Llama localement
    Projet 2 : Faire évoluer un LLM sur une plateforme cloud
    Projet 3 : Concevoir un pipeline de prompt pour une application spécifique
  • Évaluation et Suivi des Performances
  • Indicateurs pour évaluer les performances du modèle
    Outils pour le suivi de l'efficacité de l'inférence
    Améliorations itératives basées sur les retours
  • Applications Réelles et Impact
  • Études de cas de déploiement de LLM dans l'industrie
    Scalabilité et implications pratiques
    Considérations éthiques dans le déploiement des LLM
  • Récapitulatif du Cours et Tendances Futures
  • Revue des apprentissages clés
    Discussion sur les technologies émergentes et tendances des LLM
    Conseils pour approfondir l'apprentissage et le développement dans le domaine de l'IA

Enseigné par

Taught by Meta Staff


Matières

Computer Science