Building ETL and Data Pipelines with Bash, Airflow and Kafka

via edX

edX

302 Cursos


course image

Resumen

Únase a nuestro curso completo sobre Construcción de ETL y Pipelines de Datos con Bash, Airflow y Kafka, ofrecido por edX. Este curso está diseñado para equiparlo con conocimientos esenciales y habilidades prácticas en ingeniería de datos y almacenamiento de datos, enfocándose en pipelines de datos y procesos ETL bien diseñados y automatizados, que son cruciales para una plataforma de Inteligencia de Negocios próspera.

Descubra cómo definir flujos de trabajo, pipelines y procesos de datos eficientes desde el principio. Aprenda a asegurar que se recolecten, transformen y carguen los datos brutos adecuados en las capas de almacenamiento deseadas, haciéndolos disponibles de manera inmediata para el análisis. Esta habilidad es de suma importancia para el diseño inicial de la plataforma, asegurando un manejo robusto de datos y una estrategia de inteligencia empresarial.

Al final de este curso, tendrá una sólida comprensión de los procesos tanto de Extract, Transform, Load (ETL) como de Extract, Load, and Transform (ELT). Ganará experiencia práctica en la extracción, transformación y carga de datos en un área de staging. Mejore sus habilidades creando un pipeline de datos ETL utilizando scripts de Bash, construyendo un flujo de trabajo ETL por lotes utilizando Apache Airflow y desarrollando un pipeline de datos en streaming utilizando Apache Kafka.

A través de laboratorios prácticos y un proyecto inspirado en el mundo real, construirá varios pipelines de datos utilizando estas tecnologías, aumentando significativamente su portafolio y demostrando su capacidad como Ingeniero de Datos. Este curso se recomienda para aquellos con experiencia previa trabajando con conjuntos de datos, SQL, bases de datos relacionales y scripts de Bash.

Categorizado bajo Cursos de Big Data, Cursos de Apache Airflow y Cursos de Apache Kafka, este viaje educativo está destinado a moldear a Ingenieros de Datos y especialistas en Almacenamiento de Datos competentes, listos para manejar entornos de datos complejos.

Programa de estudio


Enseñado por

Rav Ahuja, Yan Luo and Jeff Grossman


Etiquetas

united states

provider edX

edX

302 Cursos


edX

pricing Free Online Course (Audit)
language English
duration 5 weeks, 2-4 hours a week
sessions On-Demand
level Beginner