Aperçu
Dans ce cours autogéré, nous parcourons le processus de planification des solutions d'analyse des données ainsi que les divers processus d'analytique de données concernés. Le cours examine les cinq facteurs clés qui indiquent le besoin de services AWS spécifiques dans la collecte, le traitement, l'analyse et la présentation des données. Cela inclut l'apprentissage des architectures de base, des propositions de valeur et des cas d'utilisation potentiels. Le cours présente les services et solutions AWS pour vous aider à créer et améliorer les solutions d'analyse des données.
Remarque : ce cours propose des transcriptions/sous-titres localisés. La narration est en anglais. Pour afficher les sous-titres, cliquez sur le bouton CC en bas à droite du lecteur.
Ce cours est destiné à :
- Data architects
- Data scientists
- Data analysts
Dans ce cours, vous apprendrez à :
- Identifier les caractéristiques des solutions d'analyse de données et les caractéristiques qui indiquent qu'une telle solution peut être nécessaire
- Définir les types de données, y compris les données structurées, semi-structurées et non structurées
- Définir les types de stockage de données comme les data lakes, AWS Lake Formation, les data warehouses et Amazon Simple Storage Service (Amazon S3)
- Analyser les caractéristiques du traitement par lots et du traitement en continu et leurs différences
- Décrire comment Amazon Kinesis est utilisé pour traiter les données en continu
- Analyser les caractéristiques des différents systèmes de stockage pour les données sources
- Analyser les caractéristiques des systèmes de traitement des transactions en ligne (Online Transaction Processing, OLTP) et du traitement analytique en ligne (Online Analytical Processing, OLAP) et leur impact sur l'organisation des données au sein de ces systèmes
- Analyser les différences entre les méthodes de stockage de données basées sur les lignes et celles basées sur les colonnes
- Définir comment Amazon EMR, AWS Glue et Amazon Redshift travaillent pour traiter, nettoyer et transformer les données au sein d'une solution d'analyse des données
- Analyser le concept de conformité à l'atomicité, la cohérence, l'isolement et la durabilité (ACID), ainsi que la conformité à la disponibilité de base, l'état mou et la cohérence éventuelle (BASE) et comment un processus d'extraction, transformation, chargement (ETL) peut aider à garantir la conformité
- Explorer le concept de schémas de données et découvrir comment ils définissent les données et comment ces informations sont stockées dans les metastores
- Analyser le concept de données par rapport aux informations
- Reconnaître les méthodes d'analyse des données pour produire des informations pour les rapports en utilisant des outils comme Amazon QuickSight et Amazon Athena
- Définir comment les services AWS collaborent pour visualiser les données
Il est recommandé que les participants à ce cours possèdent les prérequis suivants :
- Connaissances opérationnelles des concepts de base de données
- Compréhension basique du stockage, du traitement et de l'analytique des données
- Expérience avec les systèmes informatiques d'entreprise
Ce cours est composé d'une combinaison de formation numérique.
Durée : 3,5 heures
Le cours couvre les sujets suivants :
- Leçon 1 : introduction aux solutions d'analyse des données - Analytique des données et concepts d'analyse des données - Introduction aux défis de l'analytique des données
- Leçon 2 : volume - Stockage des données - Introduction à Amazon S3 - Introduction aux data lakes - Introduction
Programme
Enseigné par
Étiquettes