Resumen
Los pipelines de datos generalmente se inscriben en el paradigma EL (extracción y carga), ELT (extracción, carga y transformación) o ETL (extracción, transformación y carga). Este curso le indicará qué paradigma utilizar para el procesamiento de datos por lotes según el contexto. También le presentará varias soluciones de Google Cloud para la transformación de datos, incluyendo BigQuery, la ejecución de Spark en Dataproc, los gráficos de pipelines en Cloud Data Fusion y el procesamiento de datos sin servidor con Dataflow. Los participantes pondrán en práctica los conocimientos adquiridos creando componentes de pipelines de datos en Google Cloud utilizando Qwiklabs.
Universidad: University of Provider
Proveedor: Coursera
Categorías: Cursos de Data Warehousing, Cursos de BigQuery, Cursos de Dataflow, Cursos de Dataproc