Resumen
Amazon SageMaker ayuda a los científicos de datos a preparar, crear, entrenar, implementar y monitorear modelos de Machine Learning (ML). SageMaker reúne una amplia gama de capacidades, incluyendo acceso a bibliotecas de entrenamiento distribuido, modelos de código abierto y modelos base (FMs). Este curso presenta a los científicos de datos experimentados los desafíos de construir modelos de lenguaje y las diferentes opciones de almacenamiento, ingestión y entrenamiento para procesar un gran corpus de texto. El curso también aborda los desafíos de implementar modelos grandes y personalizar modelos base para tareas de inteligencia artificial generativa (IA generativa) utilizando Amazon SageMaker Jumpstart.
- Nivel del curso: avanzado
- Duración: 5 horas y media
Nota: Este curso tiene transcripciones/subtítulos traducidos. La narración está en inglés. Para mostrar los subtítulos, haga clic en el botón CC en la esquina inferior derecha del reproductor.
Actividades
Este curso incluye instrucciones por texto, gráficos ilustrativos, prueba de conocimientos y demostraciones en vídeo de laboratorios que puede ejecutar en su propia cuenta de Amazon Web Services (AWS).
Objetivos del curso
Después de completar este curso, los científicos de datos pueden crear, entrenar y ajustar modelos de lenguaje eficientes en AWS usando SageMaker.
En este curso, aprenderá a:
- Aplicar las mejores prácticas para almacenar e ingerir una gran cantidad de datos de texto para soportar el entrenamiento distribuido
- Explorar bibliotecas de paralelismo de datos y paralelismo de modelo para soportar el entrenamiento distribuido en SageMaker
- Explicar las opciones disponibles en SageMaker para mejorar el rendimiento del entrenamiento, como Amazon SageMaker Training Compiler y Elastic Fabric Adapter (EFA)
- Explorar técnicas de optimización para grandes modelos de lenguaje (LLM) para una implementación efectiva del modelo
- Demostrar cómo ajustar modelos base disponibles en SageMaker Jumpstart
Público objetivo
Este curso está dirigido a las siguientes funciones:
- Científicos de datos
- Ingenieros de ML
Requisitos previos
Recomendamos que los participantes de este curso tengan:
- Más de un año de experiencia con procesamiento de lenguaje natural (PLN)
- Más de un año de experiencia con entrenamiento y ajuste de modelos de lenguaje
- Competencia a nivel intermedio en programación en lenguaje Python
- Fundamentos técnicos esenciales de AWS
- Amazon SageMaker Studio para científicos de datos
Contenido del curso
Introducción a la serie de cursos
- Introducción a la creación de modelos de lenguaje en AWS
Abordaje de desafíos en la creación de modelos de lenguaje
- Desafíos comunes de los profesionales de LLM
- Escalado de LLMs con entrenamiento distribuido
- Cómo aplicar técnicas de paralelismo de datos
- Cómo aplicar técnicas de paralelismo de modelo
- Técnicas de optimización de rendimiento
- Cómo usar infraestructura con propósito específico
Cómo usar Amazon SageMaker para entrenar modelos de lenguaje
- Nociones básicas de SageMaker
- Configuración de dominio de SageMaker Studio
- Cómo elegir tipos de instancias de computación
- Nociones básicas de SageMaker Python SDK
- Entrenamiento
Programa de estudio
Enseñado por
Etiquetas