What You Need to Know Before
You Start
Starts 7 June 2025 20:48
Ends 7 June 2025
00
days
00
hours
00
minutes
00
seconds
1 hour 11 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Aperçu
Explorez le concept de simulation d'entraînement contrefactuel dans le contexte des LLMs garantissant la sécurité avec Roger Grosse de l'Université de Toronto.
Programme
- Introduction à la Formation Contrefactuelle
- Fondements Théoriques des Contrefactuels
- Formation Contrefactuelle dans les Modèles de Langage à Grande Échelle
- Sécurisation de l'IA avec les Contrefactuels
- Techniques pour la Simulation de Contrefactuels
- Études de Cas : Applications Réelles
- Orientations Futures et Opportunités de Recherche
- Atelier Pratique : Mise en Œuvre de la Formation Contrefactuelle
- Revue du Cours et Conclusion
Définition et importance dans la sécurité de l'IA
Contexte historique et développement
Aperçu de l'apprentissage des modèles de langage à grande échelle (LLMs)
Raisonnement contrefactuel en IA
Causalité et sa relation avec les contrefactuels
Principales formulations mathématiques
Compréhension des architectures de modèles de langage
Application des contrefactuels dans la formation des LLM
Études de cas et exemples de formation contrefactuelle
Introduction aux concepts de sécurité de l'IA
Rôle des contrefactuels dans l'amélioration de la fiabilité des modèles
Considérations éthiques et défis
Méthodologies de simulation
Outils et logiciels pour la simulation contrefactuelle
Meilleures pratiques et pièges courants
Analyse des implémentations réussies de formation contrefactuelle
Métriques d'évaluation et analyse d'impact
Tendances émergentes de la recherche sur l'IA contrefactuelle
Potentiel d'innovation dans les mécanismes de sécurité
Discussion des questions de recherche ouvertes
Session pratique avec guidance d'expert
Développement d'une simple simulation contrefactuelle
Exercices collaboratifs de résolution de problèmes
Résumé des concepts clés
Retour d'information des participants et discussion
Parcours d'apprentissage futurs et ressources
Sujets
Informatique