Ce que vous devez savoir avant
de commencer
Débute 23 June 2025 14:12
Se termine 23 June 2025
00
Jours
00
Heures
00
Minutes
00
Secondes
7 hours 47 minutes
Mise à niveau optionnelle disponible
Not Specified
Progressez à votre rythme
Paid Course
Mise à niveau optionnelle disponible
Aperçu
Êtes-vous prêt à libérer tout le potentiel de vos pipelines d'analyse de données ? dbt sur Databricks est un cours complet conçu pour les professionnels des données souhaitant maîtriser la transformation des données en utilisant dbt (outil de construction de données) sur la plateforme Databricks, en exploitant la puissance d'Apache Spark pour des flux de travail évolutifs et efficaces.
Programme
- Introduction à dbt et Databricks
- Configuration de votre environnement
- Fondamentaux de dbt
- Techniques avancées de dbt
- Exploiter Apache Spark avec dbt
- Implémentation de dbt dans Databricks
- Qualité des données et tests
- Débogage et optimisation
- Cas d'usage et applications réelles
- Projet de cours
- Conclusion et prochaines étapes
Aperçu de dbt et de son rôle dans la transformation des données
Introduction à Databricks et Apache Spark
Installation de dbt sur Databricks
Configuration des profils dbt pour Databricks
Comprendre le flux de travail dbt
Écriture de modèles dbt de base
Utilisation des macros et des variables
Mise en œuvre de tests et documentation
Stratégies d'optimisation des modèles
Utilisation des hooks et des opérations
Aperçu de l'architecture Apache Spark
Intégration de Spark SQL avec les modèles dbt
Gestion de grands ensembles de données avec Spark
Exécution de tâches dbt dans les notebooks Databricks
Planification et orchestration des exécutions dbt dans Databricks
Bonnes pratiques pour les tests de données dans dbt
Automatisation des tests sur Databricks
Identification et résolution des goulets d'étranglement de performance
Profilage et optimisation des requêtes avec dbt et Spark
Études de cas sur les implémentations de dbt sur Databricks
Histoires de réussite dans l'industrie
Conception et mise en œuvre d'un pipeline de transformation de données en utilisant dbt sur Databricks
Présentation et examen par les pairs des projets
Récapitulatif des concepts clés
Ressources pour un apprentissage et un développement ultérieurs
Enseigné par
Malvik Vaghadia
Sujets
Affaires