Data Engineering on AWS - A Batch Data Pipeline Solution (Includes Labs)

via AWS Skill Builder

AWS Skill Builder

352 Cours


course image

Aperçu

Les données affluent constamment dans les organisations à partir de nombreuses sources. Pour tirer des informations et de la valeur de ces données, elles doivent passer par un pipeline orchestré d'étapes d'ingestion, de stockage, de traitement et de diffusion. Ce cours vous apprendra à construire des pipelines de données par lots évolutifs, sécurisés et rentables sur AWS.

Vous apprendrez les meilleures pratiques pour ingérer des données par lots provenant de sources telles que les bases de données et les lacs de données. Le cours explore des services comme AWS Glue et Amazon EMR pour traiter et transformer les données brutes en ensembles de données prêtes pour l'analyse. Le cours couvre la catalogage des données avec AWS Glue Data Catalog. Vous apprendrez également comment diffuser des données traitées pour l'analyse, l'apprentissage automatique et les rapports en utilisant des services comme Amazon Athena et Amazon QuickSight.

Activités

Ce cours comprend du contenu interactif, des vidéos, des contrôles de connaissances, des évaluations et des ateliers pratiques.

Objectifs du cours

Dans ce cours, vous apprendrez à :

  • Décrire le but, l'architecture et les processus d'une solution de pipeline de données par lots sur AWS.
  • Identifier les services et configurations AWS appropriés pour construire une solution de pipeline de données par lots.
  • Expliquer les processus d'ingestion, de traitement, de catalogage et de diffusion des données pour la consommation dans un pipeline de données par lots.
  • Mettre en œuvre des options d'automatisation, d'orchestration, de sécurité et de gouvernance pour une solution de pipeline de données par lots.
  • Surveiller, optimiser et dépanner une solution de pipeline de données par lots sur AWS.
  • Construire et déployer une solution de pipeline de données par lots en utilisant des services AWS comme Amazon EMR, AWS Glue, Amazon S3 et Amazon Athena. (Atelier 1 et 2)
Public cible

Ce cours est destiné aux rôles professionnels suivants :

  • Ingénieurs de données
  • Scientifiques de données
  • Analystes de données
  • Ingénieurs en intelligence d'affaires
Prérequis

Nous recommandons que les participants à ce cours possèdent les éléments suivants :

  • 2 à 3 ans d'expérience en ingénierie de données
  • 1 à 2 ans d'expérience pratique avec les services AWS
  • Avoir terminé AWS Cloud Practitioner Essentials
  • Avoir terminé Les Fondamentaux de l'Analyse sur AWS - Parties 1 et 2
  • Avoir terminé Ingénierie de Données sur AWS - Fondations
Plan du cours Module 1 - Construire un Pipeline de Données par Lots (35 min)

Cette section pose les bases de la construction d'un pipeline de données par lots sur AWS. Elle couvre les considérations clés de conception, les méthodes d'ingestion de données et fournit une évaluation pour évaluer votre compréhension de la construction d'une solution de pipeline de données par lots robuste.

  • Leçon 1 : Navigation du cours
  • Leçon 2 : Introduction
  • Leçon 3 : Concevoir un Pipeline de Données par Lots
  • Leçon 4 : Ingestion de Données
  • Leçon 5 : Évaluation
  • Leçon 6 : Conclusion
  • Leçon 7 : Contactez-nous
Module 2 - Mettre en œuvre le Pipeline de Données par Lots (30 min)

Après avoir conçu le pipeline par lots, cette section plonge dans les détails de la mise en œuvre. Vous apprendrez à traiter et transformer les données

Programme


Enseigné par


Étiquettes

united states