Qué necesitas saber antes de
comenzar

Inicio 24 July 2026 18:02

Fin 24 July 2026

00 Días

00 Horas

00 Minutos

00 Segundos

Agentes de Aprendizaje Usando Q-Learning: Teoría y Código - Curso de Agentes AI Conferencia 13

Únete a nosotros en la Clase 13 del Curso de IA Agente mientras nos adentramos en el mundo de Q-Learning. Esta sesión ofrece una visión completa del aprendizaje por refuerzo a través de detalladas perspectivas teóricas y una implementación práctica en Python. Adquirirás conocimientos esenciales sobre agentes de aprendizaje y explorarás la.

Code With Aarohi via YouTube

39 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Join us in Lecture 13 of the Agentic AI Course as we delve into the world of Q-Learning. This session provides a comprehensive look at reinforcement learning through detailed theoretical insights and practical Python implementation.

You will gain essential knowledge about learning agents and explore the intricacies of Q-tables and epsilon-greedy strategies. The lecture also includes a step-by-step guide to coding a simple environment from scratch, equipping you with the skills to master these concepts effectively.

Enhance your understanding of artificial intelligence and computer science with this engaging and informative course available on YouTube.

Programa

Introducción al Aprendizaje por Refuerzo (RL)

Descripción general de los conceptos de RL

Componentes clave: agente, entorno, acciones, estados, recompensas

Fundamentos del Q-Learning

Definición y propósito del Q-Learning en RL

La Ecuación de Bellman y actualizaciones de valores Q

Dilema de Exploración vs. Explotación

La Tabla Q

Estructura y propósito de la tabla Q

Inicialización y representación de la tabla Q

Actualizaciones a la tabla Q basadas en acciones y recompensas

Estrategia Epsilon-Greedy

Explicación de la estrategia epsilon-greedy para la exploración

Equilibrio entre exploración y explotación

Modulación del valor epsilon para la eficiencia del aprendizaje

Implementación en Python

Configuración del entorno Python

Codificación de la tabla Q y mecanismo de actualización

Implementación de la selección de acciones epsilon-greedy

Construcción de un Entorno Simple

Diseño de un entorno básico para un agente de aprendizaje

Definición del espacio de estados y del espacio de acciones

Estructura de recompensas y transiciones de estado

Codificación de un Agente de Q-Learning

Integración de todos los componentes en un agente funcional

Ejecución de simulaciones y observación de la progresión del aprendizaje

Aplicaciones Prácticas y Mejoras

Escalar a entornos más complejos

Introducción de variaciones como el Q-Learning con aproximación de funciones

Conclusión y Lecturas Adicionales

Recapitulación de conceptos clave

Lecturas sugeridas y recursos para un aprendizaje avanzado

Materias

Computer Science

Qué necesitas saber antes de comenzar

Agentes de Aprendizaje Usando Q-Learning: Teoría y Código - Curso de Agentes AI Conferencia 13

39 minutes

Not Specified

Free Video

Resumen

Programa

Materias

IA para Automatización y Modelado de FP&A

FP&A con IA: Proyecto de Fin de Carrera

Interpretabilidad de los LLM - Generación de Descripciones de Características de SAE - Primavera 2026

CodeCloak: Un método basado en DRL para mitigar la fuga de código por asistentes de código LLM

IA generativa para PLN con PyTorch

Ingeniero de Aprendizaje Automático: Modelos de ML y Aprendizaje Profundo

Qué necesitas saber antes de
comenzar