Lo que necesitas saber antes de
que comiences

Comienza 6 July 2025 23:37

Termina 6 July 2025

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Aprendizaje por Refuerzo: Una Introducción Suave y Aplicación Industrial

Descubra los principios fundamentales del aprendizaje por refuerzo y obtenga información sobre sus aplicaciones prácticas en la industria. Esta sesión se centra en aprovechar las técnicas de aprendizaje por refuerzo para mejorar la eficiencia de los sistemas de drenaje sifónico en techos, que son críticos para gestionar infraestructuras de ed.
MLCon | Machine Learning Conference via YouTube

MLCon | Machine Learning Conference

2825 Cursos


50 minutes

Actualización opcional disponible

Not Specified

Progreso a tu propio ritmo

Conference Talk

Actualización opcional disponible

Resumen

Descubra los principios fundamentales del aprendizaje por refuerzo y obtenga información sobre sus aplicaciones prácticas en la industria. Esta sesión se centra en aprovechar las técnicas de aprendizaje por refuerzo para mejorar la eficiencia de los sistemas de drenaje sifónico en techos, que son críticos para gestionar infraestructuras de edificios grandes durante lluvias intensas.

La aplicación de estas técnicas puede reducir significativamente las tasas de fallos hasta en un 70%, asegurando efectividad y fiabilidad incluso en condiciones climáticas desafiantes. Presentado por expertos líderes, esta oportunidad de aprendizaje es ideal para aquellos interesados en la convergencia de la IA y la ingeniería industrial.

Mire la sesión completa en YouTube, presentada por [Universidad].

Programa de estudio

  • Introducción al Aprendizaje por Refuerzo (RL)
  • Definición y conceptos clave
    Diferencia entre aprendizaje supervisado, no supervisado y por refuerzo
    Contexto histórico y momentos de avance
  • Fundamentos del Aprendizaje por Refuerzo
  • Componentes clave: agentes, entornos, estados, acciones y recompensas
    El Proceso de Decisión de Markov (MDP)
    Funciones de valor: funciones de valor de estado y de valor de acción
    Representaciones de políticas y mejora
  • Algoritmos de RL
  • Métodos basados en modelos vs. libres de modelos
    Programación dinámica
    Métodos de Monte Carlo
    Aprendizaje por Diferencia Temporal
    Resumen de Q-learning y SARSA
  • Conceptos Avanzados de RL
  • Aprendizaje profundo por refuerzo y redes neuronales
    Métodos de gradiente de política
    Modelos actor-crítico
    Compensación entre exploración y explotación
  • Estudio de Caso: Sistemas de Drenaje de Techo Sifónicos
  • Introducción al drenaje sifónico
    Planteamiento del problema: reducción de la tasa de fallos durante lluvias intensas
    Aplicación de RL para optimizar los sistemas sifónicos
    Análisis de resultados: logrando una reducción del 70% en la tasa de fallos
  • Implementación Práctica
  • Selección del entorno y herramientas de RL adecuados
    Configuración de simulaciones para aplicaciones industriales
    Entrenamiento de modelos de RL para sistemas del mundo real
  • Desafíos y Direcciones Futuras
  • Escalabilidad y límites computacionales
    Consideraciones éticas en las aplicaciones de RL
    Tendencias futuras y posibles avances en la tecnología de RL
  • Conclusión
  • Revisión de conceptos clave y aprendizajes
    Discusión sobre el impacto del RL en varias industrias
    Proyecto final y evaluación
  • Recursos Adicionales
  • Lecturas recomendadas
    Tutoriales y herramientas en línea
    Foros comunitarios y conferencias

Asignaturas

Charlas de Conferencia