Ce que vous devez savoir avant
de commencer

Débute 4 July 2025 04:39

Se termine 4 July 2025

00 Jours
00 Heures
00 Minutes
00 Secondes
course image

Hors Distribution, Hors Contrôle ? Comprendre les Défis de Sécurité dans l'IA

Simons Institute via YouTube

Simons Institute

2765 Cours


59 minutes

Mise à niveau optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Mise à niveau optionnelle disponible

Aperçu

Programme

  • Introduction à la sécurité de l'IA
  • Aperçu des préoccupations en matière de sécurité de l'IA
    Importance de traiter la sécurité dans les systèmes d'IA
  • Problèmes hors distribution (OOD)
  • Définition et exemples de OOD
    Impact du OOD sur la performance des systèmes d'IA
    Stratégies pour détecter les données OOD
  • Fondements théoriques
  • Fondements statistiques et probabilistiques du OOD
    Robustesse dans les modèles d'IA
    Mesures d'évaluation pour les scénarios OOD
  • Modèles de langage large (LLMs)
  • Introduction aux modèles de langage large
    Cas d'utilisation communs et applications
    Limitations et modes d'échec
  • Garanties de sécurité dans l'IA
  • Définition et exemples de garanties de sécurité
    Approches pour assurer la sécurité dans les modèles d'IA
    Techniques de vérification et de validation
  • Techniques pour améliorer la sécurité
  • Méthodes d'entraînement robustes
    Entraînement et défenses adversariales
    Interprétabilité et fiabilité des modèles
  • Études de cas
  • Analyse des échecs de l'IA dans le monde réel
    Leçons apprises et améliorations de la sécurité
  • Considérations éthiques
  • Implications éthiques de la sécurité de l'IA
    Équilibrer la performance avec la sécurité
  • Ateliers pratiques
  • Exercices pratiques avec des outils open-source
    Simulations de scénarios OOD et évaluations de sécurité
  • Directions futures et défis de recherche ouverts
  • Tendances émergentes en matière de sécurité de l'IA
    Domaines clés pour la recherche et le développement futurs
  • Clôture du cours
  • Revue et discussion des concepts clés
    Réflexions finales sur l'avenir de la sécurité de l'IA et les défis OOD

Sujets

Informatique