What You Need to Know Before
You Start
Starts 6 June 2025 21:00
Ends 6 June 2025
00
days
00
hours
00
minutes
00
seconds
Cómo evaluar a los agentes de IA - Parte 2
Explora técnicas modernas de evaluación para agentes de IA, incluyendo LLM-como-juez, métodos basados en código y retroalimentación humana, con demostraciones prácticas usando Arize Phoenix para una evaluación efectiva de agentes.
Data Science Dojo
via YouTube
Data Science Dojo
2484 Cursos
50 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Explora técnicas modernas de evaluación para agentes de IA, incluyendo LLM-como-juez, métodos basados en código y retroalimentación humana, con demostraciones prácticas usando Arize Phoenix para una evaluación efectiva de agentes.
Programa de estudio
- Introducción a la Evaluación de Agentes de IA
- Panorama de Técnicas de Evaluación Moderna
- Evaluación con LLM como Juez
- Métodos de Evaluación Basados en Código
- Mecanismos de Retroalimentación Humana
- Sesiones Prácticas con Arize Phoenix
- Estudios de Caso y Aplicaciones en el Mundo Real
- Tendencias Futuras en la Evaluación de Agentes de IA
- Conclusión y Conclusiones
Panorama de los agentes de IA y sus funciones
Importancia de la evaluación en el desarrollo de IA
Clasificación de técnicas de evaluación
Elección del método de evaluación adecuado
Explicación de LLM como juez
Ventajas y limitaciones
Demostración práctica usando Arize Phoenix
Marcos de prueba automatizados
Métricas de rendimiento y benchmarking
Estudios de caso basados en código
Recolección de retroalimentación cualitativa
Diseño de estudios de usuarios para IA
Integración de la retroalimentación humana en la mejora de agentes
Introducción a la plataforma Arize Phoenix
Ejercicios prácticos: Configuración de evaluaciones
Análisis de resultados y generación de insights
Revisión de evaluaciones exitosas de agentes de IA
Lecciones aprendidas de proyectos del mundo real
Técnicas y tecnologías emergentes
Predicción de desafíos y oportunidades en la evaluación
Resumen de técnicas clave aprendidas
Estrategias para la mejora continua de la evaluación
Asignaturas
Ciencias de la Computación