What You Need to Know Before
You Start
Starts 7 June 2025 20:40
Ends 7 June 2025
00
days
00
hours
00
minutes
00
seconds
El futuro de los modelos de lenguaje: una perspectiva sobre la evaluación
Explore las metodologías de evaluación para modelos de lenguaje, examinando los enfoques actuales y las direcciones futuras para evaluar las capacidades y limitaciones de la IA.
Simons Institute
via YouTube
Simons Institute
2544 Cursos
1 hour 6 minutes
Optional upgrade avallable
Not Specified
Progress at your own speed
Free Video
Optional upgrade avallable
Resumen
Explore las metodologías de evaluación para modelos de lenguaje, examinando los enfoques actuales y las direcciones futuras para evaluar las capacidades y limitaciones de la IA.
Programa de estudio
- Introducción a los modelos de lenguaje
- Fundamentos de la evaluación en IA
- Metodologías actuales de evaluación para modelos de lenguaje
- Limitaciones de las metodologías de evaluación existentes
- Técnicas avanzadas de evaluación
- Direcciones futuras en la evaluación
- Estudios de caso y aplicaciones
- Investigación y tendencias emergentes
- Resumen y conclusiones
- Recursos complementarios
Panorama de los modelos de lenguaje: historia y evolución
Conceptos clave y terminología
Estado actual del arte
Importancia de la evaluación en el desarrollo de IA
Métricas de evaluación tradicionales
Perplejidad y entropía cruzada
BLEU, ROUGE y otras métricas basadas en N-gramas
Métodos de evaluación humana
Desafíos con los enfoques basados en N-gramas
Problemas con la evaluación humana
Métricas emergentes y sus inconvenientes
Evaluación contextualizada y basada en tareas
Evaluación de la explicabilidad e interpretabilidad del modelo
Pruebas de robustez y sesgo
Enfoques de evaluación multimodal
Consideraciones éticas y de equidad
Hacia métricas holísticas y unificadas
Evaluación en dominios específicos (por ejemplo, salud, legal)
Implementación en el mundo real y resultados
Investigación de vanguardia en técnicas de evaluación
Adopción en la industria y estándares
Resumen de las ideas clave
Preguntas abiertas y oportunidades de investigación futura
Lecturas y artículos recomendados
Herramientas y marcos para la evaluación de modelos de lenguaje
Asignaturas
Ciencias de la Computación