What You Need to Know Before
You Start

Starts 6 June 2025 21:00

Ends 6 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Cómo evaluar a los agentes de IA - Parte 2

Explora técnicas modernas de evaluación para agentes de IA, incluyendo LLM-como-juez, métodos basados en código y retroalimentación humana, con demostraciones prácticas usando Arize Phoenix para una evaluación efectiva de agentes.
Data Science Dojo via YouTube

Data Science Dojo

2484 Cursos


50 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Resumen

Explora técnicas modernas de evaluación para agentes de IA, incluyendo LLM-como-juez, métodos basados en código y retroalimentación humana, con demostraciones prácticas usando Arize Phoenix para una evaluación efectiva de agentes.

Programa de estudio

  • Introducción a la Evaluación de Agentes de IA
  • Panorama de los agentes de IA y sus funciones
    Importancia de la evaluación en el desarrollo de IA
  • Panorama de Técnicas de Evaluación Moderna
  • Clasificación de técnicas de evaluación
    Elección del método de evaluación adecuado
  • Evaluación con LLM como Juez
  • Explicación de LLM como juez
    Ventajas y limitaciones
    Demostración práctica usando Arize Phoenix
  • Métodos de Evaluación Basados en Código
  • Marcos de prueba automatizados
    Métricas de rendimiento y benchmarking
    Estudios de caso basados en código
  • Mecanismos de Retroalimentación Humana
  • Recolección de retroalimentación cualitativa
    Diseño de estudios de usuarios para IA
    Integración de la retroalimentación humana en la mejora de agentes
  • Sesiones Prácticas con Arize Phoenix
  • Introducción a la plataforma Arize Phoenix
    Ejercicios prácticos: Configuración de evaluaciones
    Análisis de resultados y generación de insights
  • Estudios de Caso y Aplicaciones en el Mundo Real
  • Revisión de evaluaciones exitosas de agentes de IA
    Lecciones aprendidas de proyectos del mundo real
  • Tendencias Futuras en la Evaluación de Agentes de IA
  • Técnicas y tecnologías emergentes
    Predicción de desafíos y oportunidades en la evaluación
  • Conclusión y Conclusiones
  • Resumen de técnicas clave aprendidas
    Estrategias para la mejora continua de la evaluación

Asignaturas

Ciencias de la Computación