What You Need to Know Before
You Start

Starts 7 June 2025 21:06

Ends 7 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Entraînement Adversarial pour la Robustesse de Sécurité des LLMs

Explorez des techniques pour améliorer la robustesse en matière de sécurité des modèles de langage de grande taille grâce à des méthodes d'entraînement antagoniste avec le chercheur Gauthier Gidel d'IVADO-Mila.
Simons Institute via YouTube

Simons Institute

2544 Cours


1 hour 1 minute

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Explorez des techniques pour améliorer la robustesse en matière de sécurité des modèles de langage de grande taille grâce à des méthodes d'entraînement antagoniste avec le chercheur Gauthier Gidel d'IVADO-Mila.

Programme

  • Introduction à l'entraînement adversarial
  • Définition et importance de l'entraînement adversarial
    Aperçu de la robustesse en matière de sécurité dans les grands modèles de langage (LLMs)
    Présentation du chercheur Gauthier Gidel et IVADO-Mila
  • Fondamentaux des grands modèles de langage (LLMs)
  • Architecture et fonctionnement des LLMs
    Limitations et vulnérabilités des LLMs
  • Comprendre les attaques adversariales
  • Types d'attaques adversariales sur les LLMs
    Études de cas des attaques adversariales sur les LLMs
  • Techniques d'entraînement adversarial
  • Méthodes d'entraînement adversarial de base
    Techniques avancées pour l'entraînement adversarial des LLMs
  • Améliorer la robustesse en matière de sécurité dans les LLMs
  • Stratégies pour améliorer la robustesse des modèles
    Mesures pour évaluer la robustesse
  • Mise en œuvre pratique de l'entraînement adversarial
  • Configuration des expériences pour l'entraînement adversarial
    Outils et bibliothèques pour mettre en œuvre l'entraînement adversarial
  • Études de cas et applications
  • Applications réelles des LLMs entraînés adversarialement
    Analyse des études de cas démontrant une robustesse améliorée
  • Défis et orientations futures
  • Défis actuels de l'entraînement adversarial pour les LLMs
    Orientations et opportunités de recherche futures
  • Conclusion et discussion
  • Principaux enseignements du cours
    Session de questions-réponses ouvertes
  • Ressources supplémentaires
  • Lectures et ressources recommandées pour une exploration plus approfondie

Sujets

Informatique