Aperçu
Vue d'ensemble
Amazon Redshift est un service d'entrepôt de données rapide et entièrement géré, évolutif jusqu'à l'échelle du pétaoctet, qui simplifie et rend économique l'analyse efficace de toutes vos données en utilisant vos outils de business intelligence (BI) existants. Il est optimisé pour les ensembles de données allant de quelques centaines de gigaoctets à un pétaoctet ou plus. L'une des avancées permettant aux clusters Amazon Redshift d'analyser autant de données est Amazon Redshift Spectrum. Cette fonctionnalité permet à Amazon Redshift d'analyser de grands volumes de données stockées dans un lac de données Amazon Simple Storage Service (Amazon S3).
Ce laboratoire utilise l'ensemble de données IMDb. IMDb est la plateforme de référence pour les fans de cinéma du monde entier. C'est la base de données en ligne d'informations relatives aux films, émissions de télévision, jeux vidéo et contenus de streaming, y compris le casting, l'équipe de production, les résumés d'intrigue, les anecdotes, les critiques de fans et de critiques, et les classements.
Objectifs
Après avoir terminé ce laboratoire, vous serez capable de :
- Utiliser SQL Workbench pour Amazon Redshift
- Comprendre la commande COPY pour charger des données et travailler avec la compression
- Utiliser un fichier manifeste pour importer des données
- Archiver des données en utilisant la commande UNLOAD
- Utiliser les opérations ANALYZE et VACUUM
- Utiliser la console Amazon Redshift pour explorer les statistiques de requête
Prérequis
Ce laboratoire nécessite :
- Accès à un ordinateur avec Wi-Fi et Microsoft Windows, macOS X ou Linux (Ubuntu, SuSE, ou Red Hat).
- Remarque : vous pouvez utiliser une tablette ou un iPad pour accéder à ces instructions dans la console du laboratoire.
- Un navigateur Internet, tel que Chrome, Firefox ou Internet Explorer 9, ou version ultérieure.
- Remarque : les versions antérieures d'Internet Explorer ne sont pas compatibles.
- Un client SSH, tel que PuTTY.
Prérequis en connaissance technique
Pour terminer ce laboratoire, vous devez être familier avec :
- Les opérations de base et les instructions SQL
- Le Console de gestion AWS
- Un client de connexion à distance (tel que Connexion Bureau à distance inclus dans la plupart des versions de Windows) pour se connecter à votre serveur
-
Remarque : si vous utilisez macOS X, téléchargez l'application Bureau à distance Microsoft dans l'App Store. Voir Client RDP pour Mac.
Dans ce laboratoire, vous utiliserez la Console de gestion AWS et SQL Workbench pour tester différentes configurations de table et conceptions de schémas. Vous utiliserez la commande COPY pour les opérations de chargement de données.
Durée
Ce laboratoire prend 60 minutes à compléter.
Services AWS non utilisés dans ce laboratoire