What You Need to Know Before
You Start
Starts 6 June 2025 21:00
Ends 6 June 2025
00
days
00
hours
00
minutes
00
seconds
Comment évaluer les agents IA - Partie 2
Explorez les techniques modernes d'évaluation pour les agents d'IA, y compris le LLM-as-judge, les méthodes basées sur le code et les retours humains, avec des démonstrations pratiques utilisant Arize Phoenix pour une évaluation efficace des agents.
Data Science Dojo
via YouTube
Data Science Dojo
2484 Cours
50 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Aperçu
Explorez les techniques modernes d'évaluation pour les agents d'IA, y compris le LLM-as-judge, les méthodes basées sur le code et les retours humains, avec des démonstrations pratiques utilisant Arize Phoenix pour une évaluation efficace des agents.
Programme
- Introduction à l'évaluation des agents d'IA
- Aperçu des techniques d'évaluation modernes
- Évaluation LLM-en-Juge
- Méthodes d'évaluation basées sur le code
- Mécanismes de retour d'information humain
- Sessions pratiques avec Arize Phoenix
- Études de cas et applications réelles
- Tendances futures dans l'évaluation des agents d'IA
- Conclusion et enseignements
Aperçu des agents d'IA et de leurs rôles
Importance de l'évaluation dans le développement de l'IA
Classification des techniques d'évaluation
Choisir la bonne méthode d'évaluation
Explication de LLM-en-juge
Avantages et limitations
Démonstration pratique utilisant Arize Phoenix
Cadres de tests automatisés
Indicateurs de performance et benchmarking
Études de cas basées sur le code
Collecte de retours d'information qualitatifs
Concevoir des études utilisateur pour l'IA
Intégrer le retour d'information humain dans l'amélioration des agents
Introduction à la plateforme Arize Phoenix
Exercices pratiques : Mise en place des évaluations
Analyser les résultats et générer des insights
Revue des évaluations réussies d'agents d'IA
Leçons tirées de projets réels
Techniques et technologies émergentes
Prédire les défis et opportunités dans l'évaluation
Résumé des techniques clés apprises
Stratégies pour une amélioration continue de l'évaluation
Sujets
Informatique