What You Need to Know Before
You Start
Starts 8 June 2025 00:52
Ends 8 June 2025
00
days
00
hours
00
minutes
00
seconds
Hors Distribution, Hors Contrôle ? Comprendre les Défis de Sécurité dans l'IA
Explorez les défis de sécurité dans l'IA, en vous concentrant sur les problèmes liés à la distribution hors échantillon et sur les garanties de sécurité pour les grands modèles de langage avec Aditi Raghunathan.
Simons Institute
via YouTube
Simons Institute
2544 Cours
59 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Aperçu
Explorez les défis de sécurité dans l'IA, en vous concentrant sur les problèmes liés à la distribution hors échantillon et sur les garanties de sécurité pour les grands modèles de langage avec Aditi Raghunathan.
Programme
- Introduction à la sécurité de l'IA
- Problèmes hors distribution (OOD)
- Fondements théoriques
- Modèles de langage large (LLMs)
- Garanties de sécurité dans l'IA
- Techniques pour améliorer la sécurité
- Études de cas
- Considérations éthiques
- Ateliers pratiques
- Directions futures et défis de recherche ouverts
- Clôture du cours
Aperçu des préoccupations en matière de sécurité de l'IA
Importance de traiter la sécurité dans les systèmes d'IA
Définition et exemples de OOD
Impact du OOD sur la performance des systèmes d'IA
Stratégies pour détecter les données OOD
Fondements statistiques et probabilistiques du OOD
Robustesse dans les modèles d'IA
Mesures d'évaluation pour les scénarios OOD
Introduction aux modèles de langage large
Cas d'utilisation communs et applications
Limitations et modes d'échec
Définition et exemples de garanties de sécurité
Approches pour assurer la sécurité dans les modèles d'IA
Techniques de vérification et de validation
Méthodes d'entraînement robustes
Entraînement et défenses adversariales
Interprétabilité et fiabilité des modèles
Analyse des échecs de l'IA dans le monde réel
Leçons apprises et améliorations de la sécurité
Implications éthiques de la sécurité de l'IA
Équilibrer la performance avec la sécurité
Exercices pratiques avec des outils open-source
Simulations de scénarios OOD et évaluations de sécurité
Tendances émergentes en matière de sécurité de l'IA
Domaines clés pour la recherche et le développement futurs
Revue et discussion des concepts clés
Réflexions finales sur l'avenir de la sécurité de l'IA et les défis OOD
Sujets
Informatique