Overview
In questo corso gestito dall'utente illustriamo il processo di pianificazione delle soluzioni di analisi dei dati e i vari processi di analitica dei dati interessati. Il corso analizza i cinque fattori chiave che indicano l'esigenza di servizi AWS specifici nella raccolta, elaborazione, analisi e presentazione dei dati. Ciò include l'apprendimento di architetture di base, proposte di valore e potenziali casi d'uso. Il corso presenta i servizi e le soluzioni AWS per aiutarti a creare e migliorare le soluzioni di analisi dei dati.
Nota: questo corso fornisce trascrizioni/sottotitoli localizzati. La narrazione è in inglese. Per visualizzare i sottotitoli, fare clic sul pulsante CC nell'angolo in basso a destra del lettore.
Questo corso è rivolto a:
- Data architect
- Data scientist
- Data analyst
In questo corso, imparerai a:
- Identificare le caratteristiche delle soluzioni di analisi dei dati e le caratteristiche che indicano che una tale soluzione può essere necessaria
- Definire i tipi di dati, inclusi dati strutturati, semistrutturati e non strutturati
- Definire i tipi di archiviazione dei dati come data lake, AWS Lake Formation, data warehouse e Amazon Simple Storage Service (Amazon S3)
- Analizzare le caratteristiche dell'elaborazione in batch e in streaming e le loro differenze
- Definire come Amazon Kinesis viene utilizzato per elaborare i dati in streaming
- Analizzare le caratteristiche dei diversi sistemi di storage per i dati di origine
- Analizzare le caratteristiche dei sistemi di elaborazione di transazioni online (Online Transaction Processing, OLTP) e di elaborazione analitica online (Online Analytical Processing, OLAP) e il loro impatto sull'organizzazione dei dati all'interno di tali sistemi
- Analizzare le differenze tra i metodi di archiviazione dei dati basati su righe e su colonne
- Definire il modo in cui Amazon EMR, AWS Glue e Amazon Redshift lavorano per elaborare, pulire e trasformare i dati all'interno di una soluzione di analisi dei dati
- Analizzare il concetto di conformità ad atomicità, coerenza, isolamento e durata (ACID), nonché di conformità a disponibilità di base, stato morbido, coerenza finale (BASE) e come un processo di estrazione, trasformazione, caricamento (ETL) può contribuire a garantire la conformità
- Esplorare il concetto di schemi di dati e scoprire come definiscono i dati e come queste informazioni vengono archiviate nei metastore
- Analizzare il concetto di dati rispetto alle informazioni
- Riconoscere le modalità di analisi dei dati per produrre informazioni per i report utilizzando strumenti come Amazon QuickSight e Amazon Athena
- Definire il modo in cui i servizi AWS collaborano per visualizzare i dati
È consigliabile che i partecipanti a questo corso possiedano i seguenti prerequisiti:
- Conoscenze operative dei concetti di database
- Comprensione di base sull'archiviazione, l'elaborazione e l'analitica dei dati
- Esperienza con i sistemi IT aziendali
Questo corso è composto da una combinazione di formazione digitale.
Durata: 3,5 ore
Il corso copre i seguenti argomenti:
- Lezione 1: introduzione alle soluzioni di analisi dei dati - Analitica dei dati e concetti di analisi dei dati - Introduzione alle sfide dell'analitica dei dati
- Lezione 2: volume - Archiviazione dei dati - Introduzione ad Amazon S3 - Introduzione ai data lake - Introduzione
Syllabus
Taught by
Tags