What You Need to Know Before
You Start

Starts 8 June 2025 00:52

Ends 8 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Hors Distribution, Hors Contrôle ? Comprendre les Défis de Sécurité dans l'IA

Explorez les défis de sécurité dans l'IA, en vous concentrant sur les problèmes liés à la distribution hors échantillon et sur les garanties de sécurité pour les grands modèles de langage avec Aditi Raghunathan.
Simons Institute via YouTube

Simons Institute

2544 Cours


59 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Explorez les défis de sécurité dans l'IA, en vous concentrant sur les problèmes liés à la distribution hors échantillon et sur les garanties de sécurité pour les grands modèles de langage avec Aditi Raghunathan.

Programme

  • Introduction à la sécurité de l'IA
  • Aperçu des préoccupations en matière de sécurité de l'IA
    Importance de traiter la sécurité dans les systèmes d'IA
  • Problèmes hors distribution (OOD)
  • Définition et exemples de OOD
    Impact du OOD sur la performance des systèmes d'IA
    Stratégies pour détecter les données OOD
  • Fondements théoriques
  • Fondements statistiques et probabilistiques du OOD
    Robustesse dans les modèles d'IA
    Mesures d'évaluation pour les scénarios OOD
  • Modèles de langage large (LLMs)
  • Introduction aux modèles de langage large
    Cas d'utilisation communs et applications
    Limitations et modes d'échec
  • Garanties de sécurité dans l'IA
  • Définition et exemples de garanties de sécurité
    Approches pour assurer la sécurité dans les modèles d'IA
    Techniques de vérification et de validation
  • Techniques pour améliorer la sécurité
  • Méthodes d'entraînement robustes
    Entraînement et défenses adversariales
    Interprétabilité et fiabilité des modèles
  • Études de cas
  • Analyse des échecs de l'IA dans le monde réel
    Leçons apprises et améliorations de la sécurité
  • Considérations éthiques
  • Implications éthiques de la sécurité de l'IA
    Équilibrer la performance avec la sécurité
  • Ateliers pratiques
  • Exercices pratiques avec des outils open-source
    Simulations de scénarios OOD et évaluations de sécurité
  • Directions futures et défis de recherche ouverts
  • Tendances émergentes en matière de sécurité de l'IA
    Domaines clés pour la recherche et le développement futurs
  • Clôture du cours
  • Revue et discussion des concepts clés
    Réflexions finales sur l'avenir de la sécurité de l'IA et les défis OOD

Sujets

Informatique