What You Need to Know Before
You Start

Starts 4 June 2025 19:09

Ends 4 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

IA demostrablemente segura y beneficiosa

Explora las ideas de Stuart Russell sobre la creación de sistemas de IA que estén matemáticamente probados para ser seguros y beneficiosos para la humanidad.
Simons Institute via YouTube

Simons Institute

2458 Cursos


1 hour 9 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Resumen

Explora las ideas de Stuart Russell sobre la creación de sistemas de IA que estén matemáticamente probados para ser seguros y beneficiosos para la humanidad.

Programa de estudio

  • Introducción a la Seguridad y Ética de la IA
  • Descripción general de los conceptos de seguridad en IA
    Consideraciones éticas en el desarrollo de la IA
    Estudios de casos de fallos de la IA y sus implicaciones
  • Fundamentos de la IA Probablemente Segura
  • Introducción a los métodos formales en IA
    Comprensión y modelado de la incertidumbre
    Mecanismos para asegurar la alineación de la IA
  • Enfoque de Stuart Russell para una IA Beneficiosa
  • Descripción general de las contribuciones de Stuart Russell
    Principios de diseño de IA compatible con humanos
    Temas avanzados en alineación de IA
  • Enfoques Técnicos para la Seguridad
  • Marcos matemáticos para la seguridad en IA
    Técnicas de verificación y validación
    Supervisión escalable y modelado recursivo de recompensas
  • Diseño de Sistemas de IA Beneficiosos
  • Sistemas multiagente e IA cooperativa
    Problema de alineación de valores y posibles soluciones
    Sistemas de IA interactivos: colaboración humano-IA
  • Evaluación y Gestión de Riesgos en IA
  • Identificación y categorización de riesgos potenciales
    Modelos de teoría de decisiones en seguridad de IA
    Estrategias de mitigación de riesgos
  • Desafíos Emergentes en Seguridad de IA
  • Exploración y aprendizaje seguro en entornos desconocidos
    Impacto a largo plazo de la IA: gobernanza y política
    Abordar el sesgo y asegurar la equidad
  • Estudios de Caso y Aplicaciones Prácticas
  • Estudios de caso de implementaciones de IA exitosas y no exitosas
    Herramientas y metodologías para el diseño de IA centrada en la seguridad
    Proyecto práctico: Diseño de un sistema de IA seguro y beneficioso
  • Conclusión y Direcciones Futuras
  • Resumen de los conceptos principales
    Problemas abiertos en seguridad de IA y direcciones de investigación futura
    Llamado a la acción: Construir un futuro de IA probadamente seguro y beneficioso

Asignaturas

Ciencias de la Computación