Sample-based Learning Methods

University of Alberta via Coursera

Coursera

5 Cours


The University of Alberta is a premier research institution situated in Edmonton, Canada. It is renowned for its outstanding teaching, research, innovation and its commitment to community involvement.

course image

Aperçu

Plongez dans le monde des méthodes d'apprentissage basées sur des exemples avec un cours complet offert par l'Université de l'Alberta sur Coursera. Ce cours explore en profondeur les algorithmes qui maîtrisent des politiques quasi-optimales à travers des interactions d'essai et d'erreur avec leur environnement, mettant en évidence le pouvoir d'apprendre directement de l'expérience personnelle d'un agent. Découvrez les fondamentaux des méthodes de Monte Carlo intuitivement simples mais puissantes et les subtilités des méthodes d'apprentissage par différence temporelle, y compris le célèbre Q-learning.

Embarquez dans un voyage pour comprendre comment fusionner la planification basée sur le modèle avec les mises à jour par différence temporelle pour booster significativement le processus d'apprentissage. À la fin du cours, les participants auront acquis la capacité de :

  • Comprendre les nuances de l'apprentissage par Différence Temporelle et des méthodes de Monte Carlo pour estimer les fonctions de valeur basées sur des expériences échantillonnées.
  • Reconnaître le rôle crucial de l'exploration dans l'exploitation de l'expérience échantillonnée par rapport aux balayages de programmation dynamique.
  • Établir des liens entre Monte Carlo, la Programmation Dynamique et les méthodes TD.
  • Développer les compétences pour implémenter et utiliser l'algorithme TD pour une estimation précise de la fonction de valeur.
  • Appliquer les techniques de Sarsa Espéré et de Q-learning à des fins de contrôle.
  • Distinguer entre les mécanismes de contrôle de politique interne et de politique externe.
  • Explorer des stratégies de planification utilisant l'expérience simulée.
  • Implémenter une approche basée sur le modèle pour l'Apprentissage par Renforcement (RL) à travers Dyna, améliorant l'efficacité de l'échantillon avec des expériences simulées.

Ce cours est classé sous les cours d'Intelligence Artificielle, d'Apprentissage par Renforcement et spécifiquement de cours de Q-learning, ce qui en fait un choix idéal pour quiconque désireux d'exceller dans ces domaines.

Programme


Enseigné par

Martha White and Adam White


Étiquettes

canada

provider Coursera

Coursera

1275 Cours


Coursera

pricing Free Online Course (Audit)
language English
duration 22 hours
sessions On-Demand
level Intermediate