Ce que vous devez savoir avant
Vous commencez

Débute 24 July 2026 18:01

Se termine 24 July 2026

00 Jours

00 Heures

00 Minutes

00 Secondes

Garanties de sécurité probabilistes en utilisant les internes du modèle

Rejoignez-nous pour une exploration perspicace des garanties de sécurité probabilistes pour les modèles de langage. Dirigée par Jacob Hilton du Alignment Research Center, cette session se concentre sur l'analyse critique des internes du modèle. Idéale pour les passionnés et les professionnels de l'intelligence artificielle et de l'informatiq.

Simons Institute via YouTube

46 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Join us for an insightful exploration of probabilistic safety guarantees for language models. Led by Jacob Hilton from the Alignment Research Center, this session focuses on the critical analysis of model internals.

Ideal for enthusiasts and professionals in artificial intelligence and computer science, this YouTube event offers cutting-edge insights into enhancing model safety and reliability.

Programme

Introduction à la sécurité probabiliste

Aperçu de la sécurité dans les systèmes d'IA

Compréhension des garanties probabilistes

Fondamentaux des internes des modèles

Architecture des modèles de langage

Composants clés et leurs fonctions

Analyse des internes des modèles

Techniques d'inspection interne

Outils et logiciels d'analyse

Méthodes probabilistes dans la sécurité de l'IA

Bases de la théorie des probabilités

Application des méthodes probabilistes dans l'IA

Développement de garanties de sécurité

Critères de sécurité dans les modèles de langage

Construction de garanties de sécurité en utilisant des approches probabilistes

Études de cas et exemples pratiques

Revue des recherches et résultats passés

Analyse de scénarios réels de modèles de langage

Mise en œuvre de cadres de sécurité

Conception de mécanismes de sécurité basés sur les internes

Test et validation des mesures de sécurité

Évaluation de la sécurité dans les modèles de langage

Métriques pour l'assurance de la sécurité

Stratégies d'évaluation et d'amélioration continues

Outils et ressources

Bibliothèques logicielles pour l'analyse des modèles

Jeux de données pour tester les protocoles de sécurité

Conférence invitée par Jacob Hilton

Perspectives du Centre de recherche sur l'alignement

Questions-réponses sur des sujets avancés de sécurité

Conclusion et directions futures

Résumé des principaux enseignements

Défis et opportunités futurs dans la sécurité de l'IA

Projet final

Application des concepts du cours

Développement d'un cadre de sécurité probabiliste pour un modèle de langage

Matières

Computer Science

Ce que vous devez savoir avant Vous commencez

Garanties de sécurité probabilistes en utilisant les internes du modèle

46 minutes

Not Specified

Free Video

Aperçu

Programme

Matières

IA pour l'automatisation et la modélisation de la FP&A (planification financière et analyse)

FP&A avec IA : Projet de Fin d'Études

Interprétabilité des LLM - Génération de Descriptions de Caractéristiques SAE - Printemps 2026

CodeCloak : une méthode basée sur DRL pour atténuer les fuites de code par les assistants de code LLM

IA générative pour le TALN avec PyTorch

Ingénieur en apprentissage automatique : Modèles d'apprentissage automatique et profond

Ce que vous devez savoir avant
Vous commencez