Resumen
Los datos fluyen constantemente hacia las organizaciones desde muchas fuentes. Para derivar conocimientos y valor de estos datos, deben pasar por un pipeline orquestado de etapas de ingestión, almacenamiento, procesamiento y servicio. Este curso te enseñará cómo construir pipelines de datos en lotes escalables, seguros y rentables en AWS.
Aprenderás las mejores prácticas para la ingestión de datos en lotes desde fuentes como bases de datos y lagos de datos. El curso explora servicios como AWS Glue y Amazon EMR para procesar y transformar los datos en bruto en datasets listos para análisis. El curso cubre la catalogación de datos con AWS Glue Data Catalog. También aprenderás cómo servir los datos procesados para análisis, aprendizaje automático e informes utilizando servicios como Amazon Athena y Amazon QuickSight.
ActividadesEste curso incluye contenido interactivo, videos, pruebas de conocimiento, evaluaciones y laboratorios prácticos.
Objetivos del cursoEn este curso, aprenderás a hacer lo siguiente:
- Describir el propósito, la arquitectura y los procesos de una solución de pipeline de datos en lotes en AWS.
- Identificar los servicios y configuraciones adecuados de AWS para construir una solución de pipeline de datos en lotes.
- Explicar los procesos de ingestión de datos, procesamiento, catalogación y servicio de datos para su consumo en un pipeline de datos en lotes.
- Implementar opciones de automatización, orquestación, seguridad y gobernanza para una solución de pipeline de datos en lotes.
- Monitorear, optimizar y solucionar problemas en una solución de pipeline de datos en lotes en AWS.
- Construir y desplegar una solución de pipeline de datos en lotes utilizando servicios de AWS como Amazon EMR, AWS Glue, Amazon S3 y Amazon Athena. (Laboratorio 1 y 2)
Este curso está destinado a los siguientes roles laborales:
- Ingenieros de Datos
- Científicos de Datos
- Analistas de Datos
- Ingenieros de Inteligencia de Negocios
Recomendamos que los asistentes de este curso tengan lo siguiente:
- 2-3 años de experiencia en ingeniería de datos
- 1-2 años de experiencia práctica con servicios de AWS
- Curso completado de AWS Cloud Practitioner Essentials
- Cursos completados de Fundamentos de Análisis en AWS - Partes 1 y 2
- Curso completado de Ingeniería de Datos en AWS - Fundamentos
Esta sección sienta las bases para construir un pipeline de datos en lotes en AWS. Cubre las consideraciones clave de diseño, métodos de ingestión de datos y proporciona una evaluación para evaluar tu comprensión de la construcción de una solución robusta de pipeline de datos en lotes.
- Lección 1: Navegación del Curso
- Lección 2: Introducción
- Lección 3: Diseño de un Pipeline de Datos en Lotes
- Lección 4: Ingestión de Datos
- Lección 5: Evaluación
- Lección 6: Conclusión
- Lección 7: Contáctenos
Después de diseñar el pipeline de lotes, esta sección profundiza en los detalles de la implementación. Aprenderás cómo procesar y transformar datos, catalogarlos para la gobernanza y servirlos para su consumo por herramientas de análisis. Una evaluación refuer