Aperçu
This advanced course transforms you into an enterprise-level ML engineer capable of designing, implementing, and operating sophisticated retrieval-augmented generation (RAG) systems. You'll progress from foundational RAG architecture to cutting-edge patterns like Self-RAG and Corrective RAG, then dive deep into production operations including secure deployment, performance optimization, and cross-platform migration.
By combining hands-on projects with real-world enterprise requirements, you'll learn to build AI systems that deliver accurate, grounded responses at scale. Each module builds practical skills used by senior ML engineers in high-stakes domains like legal tech, healthcare, and finance.
Who this is for:
Experienced software engineers and data scientists ready to build production-grade AI applications. Strong Python programming and basic machine learning knowledge required.
Programme
- Comprendre les bases de RAG
Ce module fondamental démystifie la génération augmentée par récupération. Vous apprendrez pourquoi RAG est essentiel pour créer des systèmes d'IA fiables et explorerez le rôle et la fonction de chaque composant dans son architecture. Vous terminerez en esquissant un diagramme de flux de données RAG pour consolider votre compréhension théorique.
- Modèles avancés de RAG
Allez au-delà du RAG de base pour construire des systèmes d'IA robustes et auto-correctifs. Ce cours de 2 heures enseigne aux développeurs intermédiaires à implémenter des modèles de RAG correctifs, autonomes et agentiques. Grâce à des tests A/B pratiques et à l'analyse des performances, vous apprendrez à architecturer, évaluer et défendre des pipelines de production fiables qui résolvent avec précision des requêtes complexes à étapes multiples.
- Déployer des bases de données vectorielles en toute sécurité
Passez de l'IA locale à la production avec ce cours pratique. Maîtrisez les compétences essentielles du "dernier kilomètre" : conteneuriser les bases de données avec Docker, implémenter la sécurité TLS et RBAC, et surveiller la santé via Grafana. Apprenez à analyser les performances pour le passage à l'échelle automatique, en veillant à ce que vos déploiements de bases de données vectorielles de niveau entreprise soient sécurisés, évolutifs et prêts pour la production.
- Optimiser et migrer les vecteurs
Optimiser et migrer les vecteurs est un cours pratique de niveau intermédiaire de 90 minutes pour les ingénieurs ML visant à maîtriser les opérations des bases de données vectorielles. Apprenez à optimiser les performances pour réduire la latence jusqu'à 40 % et à script des migrations sans perte de 100k+ vecteurs de Chroma vers Weaviate en utilisant Python et Docker.
- Pipeline RAG de production
Dans ce projet, vous construirez un système RAG de niveau production qui synthétise tout ce qui a été appris tout au long du programme : déploiement de base de données vectorielle, modèles avancés de RAG, sécurité, surveillance et optimisation des performances. Ce projet complet simule les exigences de l'entreprise et produit des preuves solides de capacité en ingénierie ML de bout en bout pour votre portfolio.
Enseigné par
Professionals from the Industry
Matières
Computer Science