Aperçu
Un cours complet sur Databricks SQL Warehouse et Spark SQL pour les ingénieurs en données, les analystes de données, les développeurs BI, etc.
Programme
-
- Introduction à Databricks et au Data Lakehouse
-- Aperçu de la plateforme Databricks
-- Introduction à l'architecture du Data Lakehouse
-- Avantages de l'utilisation de Databricks SQL Warehouse
- Prise en main de Databricks SQL Warehouse
-- Configuration de votre environnement Databricks
-- Navigation de base et caractéristiques de l'interface
-- Comprendre les clusters et la scalabilité
- Fondamentaux de Spark SQL
-- Introduction à la syntaxe de Spark SQL
-- DataFrames et Datasets
-- Opérations SQL courantes dans Spark
- Fonctionnalités avancées de Spark SQL
-- Jointures, agrégations, et fonctions de fenêtre
-- Gestion des JSON, types complexes, et UDFs
-- Techniques d'optimisation des performances
- Création et requêtage des Databricks SQL Warehouses
-- Création et gestion des Databricks SQL Warehouses
-- Requêtage de données avec Spark SQL
-- Meilleures pratiques pour écrire des requêtes efficaces
- Intégration et ingestion de données
-- Connexion à diverses sources de données
-- Importation et ingestion de données dans Databricks
-- Processus ETL avec Databricks
- Cas d'utilisation réels de Databricks SQL Warehouse
-- Analytique et reporting
-- Intégrations de machine learning
-- Traitement de données en temps réel
- Sécurité, conformité et gouvernance
-- Accès utilisateur et permissions
-- Chiffrement des données et normes de conformité
-- Surveillance et audit
- Ateliers pratiques et projet de synthèse
-- Laboratoires pratiques : construction de pipelines de données
-- Projets de groupe : résolution de problèmes réels
-- Présentation et retour sur le projet de synthèse
- Conclusion et perspectives d'avenir
-- Récapitulatif et points clés
-- Tendances émergentes dans Databricks et Spark SQL
-- Ressources pour un apprentissage continu
Enseigné par
Étiquettes