What You Need to Know Before
You Start
Starts 7 June 2025 12:45
Ends 7 June 2025
00
days
00
hours
00
minutes
00
seconds
Mesures pour les capacités et les dangers
Explorez des cadres de mesure complets pour les capacités d'intelligence artificielle et les dangers potentiels, en mettant l'accent sur les méthodologies d'évaluation de la sécurité pour les grands modèles de langage.
Simons Institute
via YouTube
Simons Institute
2544 Cours
59 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Aperçu
Explorez des cadres de mesure complets pour les capacités d'intelligence artificielle et les dangers potentiels, en mettant l'accent sur les méthodologies d'évaluation de la sécurité pour les grands modèles de langage.
Programme
- Introduction aux Capacités et Dangers de l'IA
- Cadres de Mesure des Capacités de l'IA
- Indicateurs pour l'Évaluation des Modèles d'IA
- Évaluation de la Sécurité dans les Systèmes d'IA
- Méthodologies d'Évaluation pour les Grands Modèles de Langage (LLM)
- Dangers Potentiels Associés aux Grands Modèles de Langage
- Protocoles de Test de Sécurité et de Fiabilité
- Recherche Actuelle et Perspectives Futures
- Projet de Fin de Parcours
- Conclusion du Cours et Ressources Complémentaires
Aperçu des systèmes d'IA et de leurs applications
Importance d'évaluer les capacités et dangers de l'IA
Terminologie et concepts clés
Définitions des capacités de l'IA
Méthodes pour évaluer les performances de l'IA
Comparaisons entre les capacités humaines et celles de l'IA
Indicateurs quantitatifs et qualitatifs
Étalonnage des modèles d'IA
Exemples concrets de mesure de la performance de l'IA
Comprendre la sécurité de l'IA et l'évaluation des risques
Principes clés de l'évaluation de la sécurité de l'IA
Études de cas sur les incidents liés à la sécurité de l'IA
Aperçu des LLM et de leurs caractéristiques uniques
Défis communs de sécurité avec les LLM
Outils et techniques pour évaluer la sécurité des LLM
Identifier les préoccupations éthiques et sécuritaires
Analyse des biais, de la désinformation et des usages malveillants
Stratégies pour atténuer les risques
Cadres de test pour les systèmes d'IA
Tests et simulations basés sur des scénarios
Surveillance continue et boucles de rétroaction
Tendances émergentes dans la mesure des capacités de l'IA
Avancées dans les méthodologies d'évaluation des dangers
Défis ouverts et opportunités de recherche en sécurité de l'IA
Application pratique des cadres de mesure
Conception d'un plan d'évaluation de la sécurité pour un système d'IA donné
Présentations et retour d'expérience entre pairs
Résumé des principaux apprentissages
Lectures recommandées et ressources pour l'étude continue
Sujets
Informatique