What You Need to Know Before
You Start

Starts 6 June 2025 21:00

Ends 6 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Comment évaluer les agents IA - Partie 2

Explorez les techniques modernes d'évaluation pour les agents d'IA, y compris le LLM-as-judge, les méthodes basées sur le code et les retours humains, avec des démonstrations pratiques utilisant Arize Phoenix pour une évaluation efficace des agents.
Data Science Dojo via YouTube

Data Science Dojo

2484 Cours


50 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Aperçu

Explorez les techniques modernes d'évaluation pour les agents d'IA, y compris le LLM-as-judge, les méthodes basées sur le code et les retours humains, avec des démonstrations pratiques utilisant Arize Phoenix pour une évaluation efficace des agents.

Programme

  • Introduction à l'évaluation des agents d'IA
  • Aperçu des agents d'IA et de leurs rôles
    Importance de l'évaluation dans le développement de l'IA
  • Aperçu des techniques d'évaluation modernes
  • Classification des techniques d'évaluation
    Choisir la bonne méthode d'évaluation
  • Évaluation LLM-en-Juge
  • Explication de LLM-en-juge
    Avantages et limitations
    Démonstration pratique utilisant Arize Phoenix
  • Méthodes d'évaluation basées sur le code
  • Cadres de tests automatisés
    Indicateurs de performance et benchmarking
    Études de cas basées sur le code
  • Mécanismes de retour d'information humain
  • Collecte de retours d'information qualitatifs
    Concevoir des études utilisateur pour l'IA
    Intégrer le retour d'information humain dans l'amélioration des agents
  • Sessions pratiques avec Arize Phoenix
  • Introduction à la plateforme Arize Phoenix
    Exercices pratiques : Mise en place des évaluations
    Analyser les résultats et générer des insights
  • Études de cas et applications réelles
  • Revue des évaluations réussies d'agents d'IA
    Leçons tirées de projets réels
  • Tendances futures dans l'évaluation des agents d'IA
  • Techniques et technologies émergentes
    Prédire les défis et opportunités dans l'évaluation
  • Conclusion et enseignements
  • Résumé des techniques clés apprises
    Stratégies pour une amélioration continue de l'évaluation

Sujets

Informatique