Aperçu
Take your data analysis skills to the next level by building, evaluating, and deploying the advanced models that power real-world AI systems. In this course, you'll work with decision trees, ensemble methods, neural networks, large language models, and conversational AI — integrating techniques that data professionals use to solve complex, production-grade problems.
You'll move from training and pruning tree-based models to quantifying ensemble lift, from diagnosing overfitting in neural networks to fine-tuning LLMs on domain-specific data. You'll also build a retrieval-augmented chatbot and evaluate NLP pipelines end to end.
By the end, you'll be able to recommend deployment-ready solutions, communicate model decisions to stakeholders, and demonstrate the breadth of skills that employers look for in intermediate-to-advanced data analyst and machine learning roles.
Programme
- Construction et élagage des arbres de décision - Fondation
Construire et élaguer des modèles CART avec des visualisations prêtes pour les parties prenantes
- Comparaison des méthodes d'ensemble - Application de base
Appliquer le bagging, le boosting, et le stacking sur le même jeu de données, comparer les métriques et quantifier le gain de l'ensemble par rapport aux modèles simples
- Évaluation du coût computationnel - Intégration et évaluation
Évaluer le coût computationnel par rapport au gain de performance pour chaque technique d'ensemble et recommander la faisabilité du déploiement
- Mise en œuvre d'un réseau feed-forward - Fondation
Construire un réseau neuronal feed-forward utilisant Keras/PyTorch, atteindre une perte de validation spécifiée et documenter les choix d'architecture
- Évaluation du surapprentissage et régularisation - Application de base
Évaluer le surapprentissage via l'analyse des courbes d'apprentissage et implémenter la régularisation (dropout/L2) pour atteindre les objectifs de généralisation
- Génération de résumés exécutifs - Fondation
Les apprenants utiliseront les LLM pour générer des premiers brouillons de résumés exécutifs qui résument les insights du modèle et affiner les prompts pour atteindre des scores ROUGE ou BLEU spécifiés
- Pipelines de données en texte - Application de base
Les apprenants créeront des pipelines de données en texte qui combinent SQL, Python, et des API LLM pour transformer automatiquement des tableaux d'indicateurs clés de performance (KPI) en résumés narratifs
- Ajustement fin et évaluation des LLM - Intégration
Les apprenants affineront de petits LLM sur les FAQs de l'entreprise et mesureront l'amélioration de la pertinence des réponses à travers une évaluation systématique par des humains
- Analyse coût-performance - Évaluation
Les apprenants évalueront les compromis coût-latence entre les LLM open-source et commerciaux pour les applications de chat en temps réel par une analyse systématique
- Développement de chatbot RAG - Fondation
Construire un prototype de chatbot utilisant RAG (génération augmentée par récupération) et mesurer la satisfaction des utilisateurs via une enquête SUS
- Optimisation du flux de dialogue - Application de base
Évaluer les métriques de flux de dialogue (taux de repli, longueur du tour) et itérer sur les règles de correspondance des intentions
- Reconnaissance d'entités nommées - Intégration
Appliquer la reconnaissance d'entités nommées pour extraire les termes clés des tickets de support et quantifier la précision/rappel
- Évaluation de la vectorisation de texte - Évaluation
Évaluer deux techniques de vectorisation (TF-IDF vs. embeddings) sur une tâche de classification de texte
- Projet : Architectures de modèles avancés et IA linguistique
Vous construisez une application de bout en bout alimentée par l'IA, qui combine la modélisation d'ensemble avec la génération d'explications pilotée par LLM. Vous entraînez et évaluez un modèle d'ensemble pour prédire les scores de santé des clients, extrayez l'importance des caractéristiques et intégrez un modèle de langage large pour générer des explications en langage naturel pour chaque prédiction. Le livrable final est une application fonctionnelle avec une interface simple et une documentation technique adaptée à une équipe de développement.
Enseigné par
Professionals from the Industry
Matières
Computer Science