Qué necesitas saber antes de
comenzar
Inicio 5 June 2026 18:37
Fin 5 June 2026
Controlar IAs no confiables con monitores
Simons Institute
6076 Cursos
1 hour 1 minute
Actualización opcional disponible
Not Specified
Avanza a tu propio ritmo
Free Video
Actualización opcional disponible
Resumen
Join us for an engaging session on the methodologies to control untrusted artificial intelligence systems through effective monitoring mechanisms. This event delves into the intricate challenges of AI safety, showcased by Anthropic's pioneering research into language models that guarantee safety.
Gain valuable insights into how these approaches can be implemented to ensure AI systems remain reliable and secure.
- Learn about the latest strategies in AI monitoring
- Discover Anthropic's innovative research on safe language model development
- Understand the implications of AI control in various technological sectors
This event is a must-attend for those passionate about AI safety and control, providing practical knowledge from leading experts in the field.”
Programa
- Introducción a la Seguridad de la IA
- Fundamentos de los Sistemas de Monitoreo
- Ideas de la Investigación de Anthropic
- Diseño de Mecanismos de Monitoreo Efectivos
- Implementación de Estructuras de Control
- Evaluación del Rendimiento de los Monitores
- Consideraciones Éticas en el Monitoreo de IA
- Direcciones Futuras en el Monitoreo de IA
- Aplicaciones Prácticas y Estudios de Caso
- Conclusión y Lecturas Adicionales
Materias
Computer Science