Sample-based Learning Methods

University of Alberta via Coursera

Coursera

5 Cursos


The University of Alberta is a premier research institution situated in Edmonton, Canada. It is renowned for its outstanding teaching, research, innovation and its commitment to community involvement.

course image

Resumen

Sumérgete en el mundo de los Métodos de Aprendizaje Basados en Muestras con un curso completo ofrecido por la Universidad de Alberta en Coursera. Este curso profundiza en algoritmos que dominan políticas casi óptimas a través de interacciones de prueba y error con su entorno, mostrando el poder de aprender directamente de la experiencia personal de un agente. Descubre los fundamentos de los métodos de Monte Carlo, intuitivamente simples pero potentes, y las complejidades de los métodos de aprendizaje por diferencia temporal, incluyendo el renombrado Q-learning.

Embárcate en un viaje para entender cómo fusionar la planificación basada en modelos con actualizaciones por diferencia temporal para impulsar significativamente el proceso de aprendizaje. Al completar el curso, los participantes habrán ganado la capacidad de:

  • Comprender los matices del aprendizaje por Diferencia Temporal y los métodos de Monte Carlo para estimar funciones de valor basadas en experiencias muestradas.
  • Reconocer el papel crítico de la exploración al aprovechar la experiencia muestrada sobre las barridas de programación dinámica.
  • Establecer conexiones entre los métodos de Monte Carlo, Programación Dinámica y TD.
  • Desarrollar las habilidades para implementar y utilizar el algoritmo TD para una estimación precisa de la función de valor.
  • Aplicar las técnicas de Expected Sarsa y Q-learning para fines de control.
  • Distinguir entre mecanismos de control de políticas directas e indirectas.
  • Explorar estrategias de planificación que utilizan experiencia simulada.
  • Implementar un enfoque basado en modelos para el Aprendizaje por Refuerzo (RL) a través de Dyna, potenciando la eficiencia de la muestra con experiencias simuladas.

Este curso se categoriza bajo Cursos de Inteligencia Artificial, Cursos de Aprendizaje por Refuerzo, y específicamente Cursos de Q-learning, haciendo que sea un ajuste ideal para cualquier persona deseosa de sobresalir en estas áreas.

Programa de estudio


Enseñado por

Martha White and Adam White


Etiquetas

canada

provider Coursera

Coursera

1450 Cursos


Coursera

pricing Free Online Course (Audit)
language English
duration 22 hours
sessions On-Demand
level Intermediate