Ce que vous devez savoir avant
Vous commencez

Débute 17 July 2026 09:29

Se termine 17 July 2026

00 Jours

00 Heures

00 Minutes

00 Secondes

S'inscrire

Techniques d'inférence pour le déploiement local et en cloud des LLM

Maîtrisez les techniques d'inférence LLM pour déployer des modèles Llama localement et dans le cloud, y compris la quantification, les pipelines de prompt et les applications évolutives dans le monde réel.

Meta via Coursera

Not Specified

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Paid Course

Amélioration optionnelle disponible

Aperçu

Expand your AI development skills by learning to run Llama models on local machines and at scale in the cloud. Master the principles of LLM inference, apply quantization for efficiency, and design prompt pipelines for real-world tasks.

Through hands-on projects, you’ll deploy an LLM-enabled tool that demonstrates scalability, performance, and practical impact.

Programme

Introduction aux LLM (Modèles de Langage de Grande Taille)

Aperçu des modèles Llama

Concepts clés des LLM : Paramètres, apprentissage, et inférence

Principes de l'Inférence des LLM

Comprendre l'inférence dans les modèles d'IA

Différences entre apprentissage et inférence

Défis de l'inférence des LLM

Déploiement Local des LLM

Mise en place d'un environnement local pour les LLM

Exécution des modèles Llama sur des machines locales

Optimisation des performances locales

Déploiement des LLM sur le Cloud

Introduction aux plateformes cloud pour l'IA

Déployer les modèles Llama dans le cloud

Gestion des ressources cloud pour la scalabilité

Efficacité de l'Inférence des LLM

Techniques pour l'optimisation des modèles

Comprendre et appliquer la quantification

Équilibrer précision et efficacité

Conception de Pipelines de Prompt

Introduction à l'ingénierie des prompts

Construire et tester des pipelines de prompt

Adapter les prompts pour diverses tâches

Projets Pratiques

Projet 1 : Déployer un modèle Llama localement

Projet 2 : Faire évoluer un LLM sur une plateforme cloud

Projet 3 : Concevoir un pipeline de prompt pour une application spécifique

Évaluation et Suivi des Performances

Indicateurs pour évaluer les performances du modèle

Outils pour le suivi de l'efficacité de l'inférence

Améliorations itératives basées sur les retours

Applications Réelles et Impact

Études de cas de déploiement de LLM dans l'industrie

Scalabilité et implications pratiques

Considérations éthiques dans le déploiement des LLM

Récapitulatif du Cours et Tendances Futures

Revue des apprentissages clés

Discussion sur les technologies émergentes et tendances des LLM

Conseils pour approfondir l'apprentissage et le développement dans le domaine de l'IA

Enseigné par

Taught by Meta Staff

Matières

Computer Science

Ce que vous devez savoir avant Vous commencez

Techniques d'inférence pour le déploiement local et en cloud des LLM

Not Specified

Not Specified

Paid Course

Aperçu

Programme

Enseigné par

Matières

IA pour l'automatisation et la modélisation de la FP&A (planification financière et analyse)

FP&A avec IA : Projet de Fin d'Études

Interprétabilité des LLM - Génération de Descriptions de Caractéristiques SAE - Printemps 2026

CodeCloak : une méthode basée sur DRL pour atténuer les fuites de code par les assistants de code LLM

IA générative pour le TALN avec PyTorch

Ingénieur en apprentissage automatique : Modèles d'apprentissage automatique et profond

Ce que vous devez savoir avant
Vous commencez