What You Need to Know Before
You Start
Starts 7 June 2025 21:06
Ends 7 June 2025
00
days
00
hours
00
minutes
00
seconds
Entraînement Adversarial pour la Robustesse de Sécurité des LLMs
Explorez des techniques pour améliorer la robustesse en matière de sécurité des modèles de langage de grande taille grâce à des méthodes d'entraînement antagoniste avec le chercheur Gauthier Gidel d'IVADO-Mila.
Simons Institute
via YouTube
Simons Institute
2544 Cours
1 hour 1 minute
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Aperçu
Explorez des techniques pour améliorer la robustesse en matière de sécurité des modèles de langage de grande taille grâce à des méthodes d'entraînement antagoniste avec le chercheur Gauthier Gidel d'IVADO-Mila.
Programme
- Introduction à l'entraînement adversarial
- Fondamentaux des grands modèles de langage (LLMs)
- Comprendre les attaques adversariales
- Techniques d'entraînement adversarial
- Améliorer la robustesse en matière de sécurité dans les LLMs
- Mise en œuvre pratique de l'entraînement adversarial
- Études de cas et applications
- Défis et orientations futures
- Conclusion et discussion
- Ressources supplémentaires
Définition et importance de l'entraînement adversarial
Aperçu de la robustesse en matière de sécurité dans les grands modèles de langage (LLMs)
Présentation du chercheur Gauthier Gidel et IVADO-Mila
Architecture et fonctionnement des LLMs
Limitations et vulnérabilités des LLMs
Types d'attaques adversariales sur les LLMs
Études de cas des attaques adversariales sur les LLMs
Méthodes d'entraînement adversarial de base
Techniques avancées pour l'entraînement adversarial des LLMs
Stratégies pour améliorer la robustesse des modèles
Mesures pour évaluer la robustesse
Configuration des expériences pour l'entraînement adversarial
Outils et bibliothèques pour mettre en œuvre l'entraînement adversarial
Applications réelles des LLMs entraînés adversarialement
Analyse des études de cas démontrant une robustesse améliorée
Défis actuels de l'entraînement adversarial pour les LLMs
Orientations et opportunités de recherche futures
Principaux enseignements du cours
Session de questions-réponses ouvertes
Lectures et ressources recommandées pour une exploration plus approfondie
Sujets
Informatique