Ce que vous devez savoir avant
Vous commencez
Débute 5 June 2026 00:29
Se termine 5 June 2026
Garanties de sécurité probabilistes en utilisant les internes du modèle
Simons Institute
6076 Cours
46 minutes
Amélioration optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Amélioration optionnelle disponible
Aperçu
Join us for an insightful exploration of probabilistic safety guarantees for language models. Led by Jacob Hilton from the Alignment Research Center, this session focuses on the critical analysis of model internals.
Ideal for enthusiasts and professionals in artificial intelligence and computer science, this YouTube event offers cutting-edge insights into enhancing model safety and reliability.
Programme
- Introduction à la sécurité probabiliste
- Fondamentaux des internes des modèles
- Analyse des internes des modèles
- Méthodes probabilistes dans la sécurité de l'IA
- Développement de garanties de sécurité
- Études de cas et exemples pratiques
- Mise en œuvre de cadres de sécurité
- Évaluation de la sécurité dans les modèles de langage
- Outils et ressources
- Conférence invitée par Jacob Hilton
- Conclusion et directions futures
- Projet final
Matières
Computer Science