Aperçu
Les pipelines de données s'inscrivent généralement dans l'un des trois paradigmes : extraction-chargement, extraction-chargement-transformation ou extraction-transformation-chargement. Ce cours décrit quel paradigme doit être utilisé dans certaines situations et quand cela se produit avec des données par lots.
De plus, nous parlerons de diverses technologies sur Google Cloud pour la transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipeline sur Cloud Data Fusion et le traitement de données sans serveur avec Dataflow. Les participants acquerront une expérience pratique dans la création de composants de pipelines de données sur Google Cloud en utilisant Qwiklabs.
Université :
Fournisseur : Coursera
Catégories : Cours d'entreposage de données, Cours Google Cloud Platform (GCP), Cours BigQuery, Cours Dataflow, Cours Dataproc