Ce que vous devez savoir avant
Vous commencez
Débute 5 June 2026 18:37
Se termine 5 June 2026
Contrôler les IA non fiables avec des moniteurs
Simons Institute
6076 Cours
1 hour 1 minute
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Amélioration optionnelle disponible
Aperçu
Join us for an engaging session on the methodologies to control untrusted artificial intelligence systems through effective monitoring mechanisms. This event delves into the intricate challenges of AI safety, showcased by Anthropic's pioneering research into language models that guarantee safety.
Gain valuable insights into how these approaches can be implemented to ensure AI systems remain reliable and secure.
- Learn about the latest strategies in AI monitoring
- Discover Anthropic's innovative research on safe language model development
- Understand the implications of AI control in various technological sectors
This event is a must-attend for those passionate about AI safety and control, providing practical knowledge from leading experts in the field.”
Programme
- Introduction à la sécurité de l'IA
- Principes fondamentaux des systèmes de surveillance
- Aperçus de la recherche d'Anthropic
- Conception de mécanismes de surveillance efficaces
- Mise en œuvre des structures de contrôle
- Évaluation des performances des moniteurs
- Considérations éthiques dans la surveillance de l'IA
- Orientations futures en matière de surveillance de l'IA
- Applications pratiques et études de cas
- Conclusion et lectures complémentaires
Matières
Computer Science