This is Part 1 of a two-part graduate sequence in deep learning. It establishes the foundations of modern deep learning and the core neural architectures behind today's AI systems.
You will build from how neural networks learn—through forward propagation and backpropagation—to convolutional networks for computer vision, recurrent networks for sequence data, and the first generative architectures:
variational autoencoders, generative adversarial networks, and Transformers. The course emphasizes both conceptual understanding and hands-on implementation in TensorFlow/Keras and PyTorch.
Part 2 continues with advanced generative modeling.
- Aperçu des Réseaux Neuronaux et de l'Apprentissage Profond
L'apprentissage profond a transformé l'intelligence artificielle en permettant aux modèles d'apprendre des représentations hiérarchiques directement à partir de données brutes, surpassant de manière spectaculaire les approches traditionnelles conçues manuellement dans les domaines de la vision, du langage et des sciences. Vous construirez le vocabulaire conceptuel et pratique sur lequel repose tout le cours : comment les réseaux neuronaux sont construits, comment l'entraînement progresse à travers des passes avant et arrière, et pourquoi l'apprentissage profond est particulièrement adapté aux données non structurées et de haute dimension.
- Réseaux Neuronaux Convolutionnels
Les réseaux neuronaux convolutionnels sont l'épine dorsale architecturale de la vision par ordinateur moderne et un composant que vous rencontrerez à plusieurs reprises tout au long de ce cours—à l'intérieur des autoencodeurs, des GAN et des modèles de diffusion U-Net. Vous développerez la capacité de lire, concevoir et raisonner sur les architectures CNN, des opérations de convolution au niveau du filtre aux conceptions phares comme VGG et ResNet, et apprendrez comment les modèles préentraînés peuvent être adaptés à de nouvelles tâches grâce à l'apprentissage par transfert.
- Introduction à la Vision par Ordinateur
La vision par ordinateur est le domaine qui permet aux machines de percevoir et d'interpréter l'information visuelle—le domaine où l'apprentissage profond a d'abord obtenu des performances supérieures à celles de l'homme. Vous explorerez ses tâches principales, de la classification d'images et la détection d'objets à la segmentation sémantique, puis parcourrez l'ensemble du pipeline de détection de la famille R-CNN à YOLOv8, acquérant une profondeur architecturale suffisante pour comprendre comment ces systèmes sont étendus et ajustés pour de nouveaux domaines.
- Réseaux Neuronaux Récurrents
Les modèles que vous avez étudiés dans les modules précédents traitent les entrées comme des structures fixes et arrangées spatialement. De nombreux problèmes réels impliquent des séquences où l'ordre est important et le contexte s'accumule au fil du temps : texte, parole, données de séries temporelles, signaux financiers. Vous apprendrez comment les RNN traitent les séquences à travers un état caché, comment les LSTM et GRU s'attaquent au problème du gradient qui disparaît, et pourquoi ces architectures—et leurs modes de défaillance—ont directement motivé le mécanisme d'attention couvert dans le module Transformer.
- Autoencodeurs Variationnels
Ce module marque le point d'inflexion du cours : le passage des modèles discriminatifs qui apprennent des frontières de décision aux modèles génératifs qui apprennent à synthétiser de nouvelles données. Vous explorerez l'ensemble du paysage génératif—VAEs, GANs, modèles autorégressifs, flux normalisants, modèles de diffusion et modèles basés sur l'énergie—avant de plonger dans l'autoencodeur et son extension probabiliste, l'Autoencodeur Variationnel.
- Réseaux Antagonistes Génératifs
Les réseaux antagonistes génératifs adoptent une approche fondamentalement différente de la modélisation générative : plutôt que de maximiser un objectif de vraisemblance, deux réseaux s'entraînent en compétition. Vous parcourrez l'ensemble de l'outil GAN—des GAN convolutionnels profonds et des techniques de stabilisation de l'entraînement à la distance Wasserstein, la pénalité de gradient, la génération conditionnelle et la traduction de domaine cycle-consistante.
- Transformers
Introduit dans "Attention Is All You Need" (Vaswani et al., 2017), le Transformer est sans doute le développement architectural le plus conséquent en apprentissage profond depuis le CNN. Vous dériverez le mécanisme d'attention à partir des premiers principes—Query, Key, Value, produit scalaire à points redimensionnés, attention multi-tête—assemblerez l'architecture complète avec l'encodage positionnel et le masquage causal, et le verrez appliqué dans un modèle de langage de style GPT.