Lo que necesitas saber antes de
que comiences

Comienza 24 June 2025 00:22

Termina 24 June 2025

00 Días
00 Horas
00 Minutos
00 Segundos
course image

Curación de Datos para el Ajuste Fino de Modelos de Lenguaje de Código Abierto

Explore los desafíos de curación de datos y las estrategias para ajustar modelos de lenguaje de código abierto, centrándose en la calidad del conjunto de datos y las técnicas de iteración para obtener mejores resultados.
Data Science Festival via YouTube

Data Science Festival

2753 Cursos


19 minutes

Actualización opcional disponible

Not Specified

Progreso a tu propio ritmo

Free Video

Actualización opcional disponible

Resumen

Explore los desafíos de curación de datos y las estrategias para ajustar modelos de lenguaje de código abierto, centrándose en la calidad del conjunto de datos y las técnicas de iteración para obtener mejores resultados.

Programa de estudio

  • Introducción a la Curación de Datos para el Ajuste Fino de LLM
  • Visión General de los Modelos de Lenguaje Extenso (LLMs)
    Importancia de la Curación de Datos en el Ajuste Fino
    Objetivo y Alcance del Curso
  • Comprensión de LLM de Código Abierto
  • Plataformas y Herramientas Populares de LLM de Código Abierto
    Ventajas y Limitaciones de los Modelos de Código Abierto
  • Calidad de Datos para el Ajuste Fino
  • Características de Conjuntos de Datos de Alta Calidad
    Métricas de Calidad de Datos y Cómo Medirlas
    Identificación y Reducción del Sesgo en los Datos
  • Recopilación y Preprocesamiento de Datos
  • Fuentes para la Recolección de Datos
    Técnicas de Limpieza de Datos
    Preprocesamiento de Texto para LLMs
  • Estrategias de Curación de Datos
  • Métodos de Curación Manual vs. Automatizada
    Uso de Metadatos para una Curación Mejorada
    Versionado y Mejora Iterativa de Conjuntos de Datos
  • Técnicas de Iteración para Resultados Mejorados
  • Ciclos de Retroalimentación en el Ajuste Fino
    Integración Continua de Nuevos Datos
    Evaluación y Pruebas de Modelos Ajustados
  • Herramientas y Tecnologías para la Curación de Datos
  • Visión General de Herramientas de Anotación de Datos
    Empleo de Herramientas de IA y ML para la Curación de Datos
    Bibliotecas y Marcos de Código Abierto
  • Estudios de Caso y Aplicaciones en el Mundo Real
  • Ejemplos de Proyectos Exitosos de Curación de Datos
    Análisis de Fracasos y Lecciones Aprendidas
  • Consideraciones Éticas en la Curación de Datos
  • Abordar Preocupaciones de Privacidad y Seguridad
    Garantizar Transparencia y Rendición de Cuentas
  • Conclusión y Direcciones Futuras
  • Tendencias Emergentes en Curación de Datos para LLMs
    Resumen del Curso y Reflexiones Finales
  • Proyecto Final
  • Diseñar e Implementar un Flujo de Trabajo de Curación de Datos para el Ajuste Fino
    Sesiones de Revisión por Pares y Retroalimentación

Asignaturas

Ciencia de Datos