Resumen
Amazon SageMaker ayuda a los científicos de datos a preparar, crear, entrenar, implementar y supervisar modelos de machine learning (ML). SageMaker reúne un amplio conjunto de capacidades, incluido el acceso a bibliotecas de formación distribuidas, modelos de código abierto y modelos básicos. Este curso les presenta a los científicos de datos experimentados los desafíos de la creación de modelos lingüísticos y las distintas opciones de almacenamiento, ingesta y formación para procesar un corpus de texto de gran tamaño. El curso aborda también los desafíos de implementar modelos de gran tamaño y de personalizar modelos básicos para tareas de inteligencia artificial generativa mediante Amazon SageMaker Jumpstart.
- Nivel del curso: avanzado
- Duración: 5,5 horas
Nota: Este curso tiene transcripciones o subtítulos localizados. La narración está en inglés. Para mostrar los subtítulos, haga clic en el botón CC en la esquina inferior derecha del reproductor.
Actividades
Este curso incluye instrucciones en texto, gráficos ilustrativos, preguntas de evaluación de conocimientos y demostraciones en video de laboratorios que puede ejecutar en su propia cuenta de Amazon Web Services (AWS).
Objetivos del curso
Después de completar este curso, los científicos de datos podrán construir, entrenar y ajustar con confianza modelos lingüísticos de gran desempeño en AWS con SageMaker.
En este curso, aprenderá a hacer lo siguiente:
- Aplicar las prácticas recomendadas de almacenamiento e ingesta de una gran cantidad de datos de texto para apoyar la formación distribuida
- Explorar las bibliotecas de paralelismo de datos y paralelismo de modelos para apoyar la formación distribuida en SageMaker
- Explicar las opciones disponibles en SageMaker para mejorar el rendimiento de la formación, como el compilador de formación de Amazon y Elastic Fabric Adapter (EFA)
- Explorar técnicas de optimización de grandes modelos lingüísticos para un despliegue eficaz de los modelos
- Demostrar cómo ajustar finamente los modelos fundacionales disponibles en SageMaker Jumpstart.
A quién se dirige
Este curso está destinado a quienes desempeñan las siguientes funciones:
- Científicos de datos
- Ingenieros de ML
Requisitos previos
Recomendamos que los asistentes a este curso cuenten con esta experiencia:
- Más de 1 año de experiencia en procesamiento del lenguaje natural (PLN)
- Más de 1 año de experiencia en la formación y la optimización de modelos lingüísticos
- Conocimientos de nivel intermedio de programación con lenguaje Python
- Fundamentos técnicos de AWS
- Amazon SageMaker Studio para científicos de datos
Esquema del curso
Introducción a la serie de cursosSección 1: introducción
- Introducción a la creación de modelos de lenguaje en AWS
Sección 2: aspectos básicos de los modelos lingüísticos de gran tamaño
- Tipos de modelos lingüísticos de gran tamaño
- Casos prácticos comunes de IA generativa
Sección 3: esquema de la serie de cursos