Ce que vous devez savoir avant
de commencer
Débute 4 July 2025 13:51
Se termine 4 July 2025
Garanties de sécurité probabilistes en utilisant les internes du modèle
Simons Institute
2777 Cours
46 minutes
Mise à niveau optionnelle disponible
Not Specified
Progressez à votre rythme
Free Video
Mise à niveau optionnelle disponible
Aperçu
Rejoignez-nous pour une exploration perspicace des garanties de sécurité probabilistes pour les modèles de langage. Dirigée par Jacob Hilton du Alignment Research Center, cette session se concentre sur l'analyse critique des internes du modèle.
Idéale pour les passionnés et les professionnels de l'intelligence artificielle et de l'informatique, cet événement YouTube offre des perspectives de pointe pour améliorer la sécurité et la fiabilité des modèles.
Programme
- Introduction à la sécurité probabiliste
- Fondamentaux des internes des modèles
- Analyse des internes des modèles
- Méthodes probabilistes dans la sécurité de l'IA
- Développement de garanties de sécurité
- Études de cas et exemples pratiques
- Mise en œuvre de cadres de sécurité
- Évaluation de la sécurité dans les modèles de langage
- Outils et ressources
- Conférence invitée par Jacob Hilton
- Conclusion et directions futures
- Projet final
Sujets
Informatique