What You Need to Know Before
You Start

Starts 7 June 2025 20:40

Ends 7 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

El futuro de los modelos de lenguaje: una perspectiva sobre la evaluación

Explore las metodologías de evaluación para modelos de lenguaje, examinando los enfoques actuales y las direcciones futuras para evaluar las capacidades y limitaciones de la IA.
Simons Institute via YouTube

Simons Institute

2544 Cursos


1 hour 6 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Free Video

Optional upgrade avallable

Resumen

Explore las metodologías de evaluación para modelos de lenguaje, examinando los enfoques actuales y las direcciones futuras para evaluar las capacidades y limitaciones de la IA.

Programa de estudio

  • Introducción a los modelos de lenguaje
  • Panorama de los modelos de lenguaje: historia y evolución
    Conceptos clave y terminología
    Estado actual del arte
  • Fundamentos de la evaluación en IA
  • Importancia de la evaluación en el desarrollo de IA
    Métricas de evaluación tradicionales
  • Metodologías actuales de evaluación para modelos de lenguaje
  • Perplejidad y entropía cruzada
    BLEU, ROUGE y otras métricas basadas en N-gramas
    Métodos de evaluación humana
  • Limitaciones de las metodologías de evaluación existentes
  • Desafíos con los enfoques basados en N-gramas
    Problemas con la evaluación humana
    Métricas emergentes y sus inconvenientes
  • Técnicas avanzadas de evaluación
  • Evaluación contextualizada y basada en tareas
    Evaluación de la explicabilidad e interpretabilidad del modelo
    Pruebas de robustez y sesgo
  • Direcciones futuras en la evaluación
  • Enfoques de evaluación multimodal
    Consideraciones éticas y de equidad
    Hacia métricas holísticas y unificadas
  • Estudios de caso y aplicaciones
  • Evaluación en dominios específicos (por ejemplo, salud, legal)
    Implementación en el mundo real y resultados
  • Investigación y tendencias emergentes
  • Investigación de vanguardia en técnicas de evaluación
    Adopción en la industria y estándares
  • Resumen y conclusiones
  • Resumen de las ideas clave
    Preguntas abiertas y oportunidades de investigación futura
  • Recursos complementarios
  • Lecturas y artículos recomendados
    Herramientas y marcos para la evaluación de modelos de lenguaje

Asignaturas

Ciencias de la Computación