Data Engineering on AWS - A Batch Data Pipeline Solution (Includes Labs)

via AWS Skill Builder

AWS Skill Builder

352 Cursos


course image

Resumen

Los datos fluyen constantemente hacia las organizaciones desde muchas fuentes. Para derivar conocimientos y valor de estos datos, deben pasar por un pipeline orquestado de etapas de ingestión, almacenamiento, procesamiento y servicio. Este curso te enseñará cómo construir pipelines de datos en lotes escalables, seguros y rentables en AWS.

Aprenderás las mejores prácticas para la ingestión de datos en lotes desde fuentes como bases de datos y lagos de datos. El curso explora servicios como AWS Glue y Amazon EMR para procesar y transformar los datos en bruto en datasets listos para análisis. El curso cubre la catalogación de datos con AWS Glue Data Catalog. También aprenderás cómo servir los datos procesados para análisis, aprendizaje automático e informes utilizando servicios como Amazon Athena y Amazon QuickSight.

Actividades

Este curso incluye contenido interactivo, videos, pruebas de conocimiento, evaluaciones y laboratorios prácticos.

Objetivos del curso

En este curso, aprenderás a hacer lo siguiente:

  • Describir el propósito, la arquitectura y los procesos de una solución de pipeline de datos en lotes en AWS.
  • Identificar los servicios y configuraciones adecuados de AWS para construir una solución de pipeline de datos en lotes.
  • Explicar los procesos de ingestión de datos, procesamiento, catalogación y servicio de datos para su consumo en un pipeline de datos en lotes.
  • Implementar opciones de automatización, orquestación, seguridad y gobernanza para una solución de pipeline de datos en lotes.
  • Monitorear, optimizar y solucionar problemas en una solución de pipeline de datos en lotes en AWS.
  • Construir y desplegar una solución de pipeline de datos en lotes utilizando servicios de AWS como Amazon EMR, AWS Glue, Amazon S3 y Amazon Athena. (Laboratorio 1 y 2)
Audiencia objetivo

Este curso está destinado a los siguientes roles laborales:

  • Ingenieros de Datos
  • Científicos de Datos
  • Analistas de Datos
  • Ingenieros de Inteligencia de Negocios
Requisitos previos

Recomendamos que los asistentes de este curso tengan lo siguiente:

  • 2-3 años de experiencia en ingeniería de datos
  • 1-2 años de experiencia práctica con servicios de AWS
  • Curso completado de AWS Cloud Practitioner Essentials
  • Cursos completados de Fundamentos de Análisis en AWS - Partes 1 y 2
  • Curso completado de Ingeniería de Datos en AWS - Fundamentos
Esquema del curso Módulo 1 - Construyendo un Pipeline de Datos en Lotes (35 min)

Esta sección sienta las bases para construir un pipeline de datos en lotes en AWS. Cubre las consideraciones clave de diseño, métodos de ingestión de datos y proporciona una evaluación para evaluar tu comprensión de la construcción de una solución robusta de pipeline de datos en lotes.

  • Lección 1: Navegación del Curso
  • Lección 2: Introducción
  • Lección 3: Diseño de un Pipeline de Datos en Lotes
  • Lección 4: Ingestión de Datos
  • Lección 5: Evaluación
  • Lección 6: Conclusión
  • Lección 7: Contáctenos
Módulo 2 - Implementación del Pipeline de Datos en Lotes (30 min)

Después de diseñar el pipeline de lotes, esta sección profundiza en los detalles de la implementación. Aprenderás cómo procesar y transformar datos, catalogarlos para la gobernanza y servirlos para su consumo por herramientas de análisis. Una evaluación refuer

Programa de estudio


Enseñado por


Etiquetas

united states