Aperçu
This long course focuses on the operational lifecycle of agentic AI systems:
robust partitioning and dataset management, automated retraining pipelines, continuous monitoring for drift and anomalies, testing and secure deployment, and performance optimization of code and pipelines. You will practice partitioning strategies (time-series and stratified), monitoring and drift detection metrics (PSI and KS), and build CI/CD notebooks and automated workflows for model retraining and re-deployment using tools like MLflow and GitHub Actions.
The course addresses software-engineering best practices—clean code, profiling, unit and integration testing—and dependency risk assessment to maintain secure, reliable production systems. Practical assignments include building monitoring alerting rules, implementing retraining triggers, diagnosing runtime bottlenecks, and integrating human-in-the-loop feedback systems to continuously improve models in production while ensuring high code quality and security hygiene.
Programme
- Partitionner et Surveiller les Modèles d'IA Efficacement
Ce module est conçu pour les data scientists et ingénieurs confrontés à la crise silencieuse du dérive des modèles. Dans ce cours, vous irez au-delà du déploiement pour garantir la fiabilité à long terme des modèles. Vous maîtriserez trois piliers critiques de l'MLOps : une partition équitable des données en utilisant des divisions stratifiées et en séries temporelles, et une surveillance continue pour détecter la dérive des données ou des concepts via l'Indice de Stabilité de la Population (PSI) et la Divergence KL. À travers des ateliers pratiques, vous construirez des pipelines de réentraînement automatisés et auto-réparateurs. En maîtrisant l'ensemble du cycle de vie, vous concevrez des systèmes d'IA de qualité production qui s'adaptent aux nouvelles données et offrent une valeur durable.
- Automatiser, Évaluer et Déployer des Modèles ML en Toute Confiance
Il s'agit d'un module pratique pour les ingénieurs ML visant à maîtriser l'MLOps de qualité production. Il vous aidera à aller au-delà des scores de précision pour prendre des décisions basées sur les données en analysant les essais d'hyperparamètres Optuna, en équilibrant la performance avec des indicateurs clés de performance commerciale comme la latence et le coût. Vous construirez un pipeline CI/CD complet en utilisant GitHub Actions, intégrant MLflow pour le suivi des expériences et la reproductibilité. En mettant en œuvre des barrières de validation automatisées, vous vous assurerez que seuls les modèles performants atteignent la production. Ce cours vous équipe d'un projet prêt pour le portefeuille, prouvant votre capacité à combler le fossé entre l'expérimentation et une valeur réelle et évolutive.
- Optimiser Python pour l'IA Agentique
Ce module est conçu pour les développeurs visant à élever leur code de fonctionnel à de qualité professionnelle. En IA, un code inefficace ou illisible paralyse la performance et la collaboration. Ce cours vous équipe de pratiques d'ingénierie logicielle pour écrire du Python à la fois hautement efficace et exceptionnellement clair. Vous maîtriserez les normes PEP 8, les indications de type, et les docstrings descriptives pour produire des modules maintenables. À travers des ateliers pratiques, vous effectuerez un réglage systématique à l'aide de cProfile pour identifier les goulets d'étranglement et refactoriser pour la vitesse. À la fin, vous équilibrerez en toute confiance la lisibilité et l'efficacité à l'exécution, garantissant que vos systèmes d'IA sont robustes, évolutifs et prêts pour la production.
- Tester et Sécuriser Votre Code d'IA
Dans ce module, les apprenants démontrent leur maîtrise en construisant une suite de tests robuste en utilisant pytest pour atteindre une couverture de code de 88%. Le programme se concentre sur un scénario réel : évaluer une mise à niveau de LangChain (v0.1.5 à v0.1.8) dans un environnement local Python. Vous analyserez les journaux des changements pour les dépréciations, effectuerez des analyses de sécurité et exécuterez des tests d'intégration pour garantir la compatibilité. À travers des ateliers pratiques et des quiz basés sur des scénarios, vous développerez un rapport structuré couvrant les évaluations de mise à niveau et les améliorations CI/CD. Ce projet final sert de ressource professionnelle pour protéger le code d’IA et garantir la fiabilité à long terme de la production.
- Détecter les Anomalies d'IA : Détecteurs de Pointes en Temps Réel
Ce module est conçu pour les ingénieurs MLOps axés sur la fiabilité de la production. Les alertes statiques échouent souvent dans des environnements dynamiques; ce cours vous enseigne à construire des systèmes d'alerte précoce intelligents pour attraper les échecs silencieux avant qu'ils ne s'aggravent. Vous maîtriserez des méthodes statistiques telles que le Z-score et la Moyenne Mobile Porexponentiellement Pondérée (EWMA) pour détecter les anomalies en utilisant des seuils dynamiques sur les données en continu. Au-delà des statistiques, vous mettrez en œuvre des modèles de Forêt d'Isolation pour découvrir des anomalies complexes. À travers des ateliers pratiques, vous apprendrez à différencier les défaillances du système des dérives bénignes, en réglant les paramètres pour minimiser les faux positifs et la fatigue d'alerte pour des pipelines MLOps robustes et modernes.
- Automatiser, Analyser, et Réagir à l'IA
Ce module s'adresse aux professionnels de l'MLOps construisant des systèmes résilients et auto-améliorants. Pour lutter contre la dérive des modèles, vous apprendrez à concevoir des pipelines Human-in-the-Loop (HITL) qui dirigent les prédictions à faible confiance vers une expertise pour examen et automatisent le réentraînement avec des données de haute qualité. Au-delà des métriques de base, vous maîtriserez des techniques d'évaluation avancées. À travers des ateliers pratiques, vous générerez des courbes de Précision-Rappel (PR) et appliquerez des méthodes de rééchantillonnage pour une meilleure généralisation. En apprenant à sélectionner les seuils de décision optimaux, vous équilibrerez les objectifs commerciaux—comme maximiser le rappel tout en minimisant les fausses alertes—transformant l'expertise humaine en un moteur continu pour l'excellence des modèles.
- Surveillance et Réentraînement en Production
Ce module vous apprend à construire un pipeline MLOps autonome et de bout en bout qui maintient la santé à long terme de vos modèles de production. Vous apprendrez à concevoir un système dynamique et auto-réparateur qui va au-delà des déploiements statiques. Vous implémenterez une surveillance robuste pour suivre les indicateurs de performance clés et configurerez une détection automatisée de la dérive pour identifier les changements dans les données ou les concepts en temps réel. Lorsqu'une dérive est détectée, votre système déclenchera un pipeline de réentraînement reproductible. Enfin, vous apprendrez à valider automatiquement et à déployer en douceur le modèle récemment réentraîné, garantissant que vos systèmes d’IA restent précis, fiables et efficaces sans intervention manuelle.
Enseigné par
Professionals from the Industry
Matières
Computer Science