Qué necesitas saber antes de
comenzar

Inicio 24 July 2026 12:15

Fin 24 July 2026

00 Días

00 Horas

00 Minutos

00 Segundos

El futuro de los modelos de lenguaje: una perspectiva sobre la evaluación

Emprenda un viaje para comprender las metodologías para evaluar los modelos de lenguaje. Esta discusión se centra en las prácticas de evaluación existentes y las posibles tendencias futuras para evaluar las habilidades y limitaciones de la inteligencia artificial. Obtenga información de esta exploración completa en el ámbito de la IA,.

Simons Institute via YouTube

1 hour 6 minutes

Actualización opcional disponible

Not Specified

Avanza a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Embark on a journey to understand the methodologies for evaluating language models. This discussion focuses on existing evaluation practices and potential future trends for assessing artificial intelligence's abilities and constraints.

Gain insights from this comprehensive exploration into the realm of AI, exclusively on YouTube.

Categories include:

Artificial Intelligence Courses
Computer Science Courses

Programa

Introducción a los modelos de lenguaje

Panorama de los modelos de lenguaje: historia y evolución

Conceptos clave y terminología

Estado actual del arte

Fundamentos de la evaluación en IA

Importancia de la evaluación en el desarrollo de IA

Métricas de evaluación tradicionales

Metodologías actuales de evaluación para modelos de lenguaje

Perplejidad y entropía cruzada

BLEU, ROUGE y otras métricas basadas en N-gramas

Métodos de evaluación humana

Limitaciones de las metodologías de evaluación existentes

Desafíos con los enfoques basados en N-gramas

Problemas con la evaluación humana

Métricas emergentes y sus inconvenientes

Técnicas avanzadas de evaluación

Evaluación contextualizada y basada en tareas

Evaluación de la explicabilidad e interpretabilidad del modelo

Pruebas de robustez y sesgo

Direcciones futuras en la evaluación

Enfoques de evaluación multimodal

Consideraciones éticas y de equidad

Hacia métricas holísticas y unificadas

Estudios de caso y aplicaciones

Evaluación en dominios específicos (por ejemplo, salud, legal)

Implementación en el mundo real y resultados

Investigación y tendencias emergentes

Investigación de vanguardia en técnicas de evaluación

Adopción en la industria y estándares

Resumen y conclusiones

Resumen de las ideas clave

Preguntas abiertas y oportunidades de investigación futura

Recursos complementarios

Lecturas y artículos recomendados

Herramientas y marcos para la evaluación de modelos de lenguaje

Materias

Computer Science

Qué necesitas saber antes de comenzar

El futuro de los modelos de lenguaje: una perspectiva sobre la evaluación

1 hour 6 minutes

Not Specified

Free Video

Resumen

Programa

Materias

IA para Automatización y Modelado de FP&A

FP&A con IA: Proyecto de Fin de Carrera

Interpretabilidad de los LLM - Generación de Descripciones de Características de SAE - Primavera 2026

CodeCloak: Un método basado en DRL para mitigar la fuga de código por asistentes de código LLM

IA generativa para PLN con PyTorch

Ingeniero de Aprendizaje Automático: Modelos de ML y Aprendizaje Profundo

Qué necesitas saber antes de
comenzar