Ce que vous devez savoir avant
Vous commencez

Débute 22 July 2026 15:54

Se termine 22 July 2026

00 Jours

00 Heures

00 Minutes

00 Secondes

Comment construire un lac de données cloud native avec des technologies open source

Rejoignez notre guide complet sur la construction d'un data lake cloud native en utilisant des technologies open source de pointe. Cette session vous guidera à travers le déploiement d'un data lake basé sur Kubernetes, de la phase d'installation initiale à l'exécution d'un prototype pleinement fonctionnel sur votre machine locale. Acquérez.

Canonical Ubuntu via YouTube

30 minutes

Amélioration optionnelle disponible

Not Specified

Progressez à votre rythme

Free Video

Amélioration optionnelle disponible

Aperçu

Join our comprehensive guide on building a cloud native data lake utilizing cutting-edge open source technologies. This session will walk you through deploying a Kubernetes-based data lake, from the initial setup phase to running a fully functional prototype on your local machine.

Gain hands-on experience and insights into creating data-driven solutions that are efficient and scalable. Perfect for learners interested in artificial intelligence and business courses.

Find this invaluable educational resource provided by YouTube.

Programme

Introduction aux lacs de données natifs cloud

Aperçu des architectures natives cloud

Avantages des lacs de données pour le stockage et l'analyse des données

Fondamentaux de Kubernetes

Comprendre l'orchestration de conteneurs

Mise en place d'un cluster Kubernetes local (Minikube, kind ou K3s)

Opérations de base de Kubernetes : Pods, Services et Déploiements

Technologies Open Source pour les lacs de données

Apache Hadoop et HDFS

Apache Spark pour le traitement des données

Apache Kafka pour l'ingestion de données en temps réel

Couche de stockage

Mise en place de systèmes de fichiers distribués

Configuration de solutions de stockage d'objets (par exemple, MinIO, Ceph)

Ingestion de données

Configuration de pipelines d'ingestion de données avec Kafka

Exploration d'outils ETL comme Apache NiFi et Apache Airflow

Traitement des données

Exécution des tâches Spark sur Kubernetes

Mise en œuvre du traitement par lots et du traitement en flux

Accès aux données et requêtes

Mise en place de moteurs de requête SQL (par exemple, Presto, Trino)

Utilisation d'Hive Metastore pour la gestion des schémas

Sécurité et gouvernance

Mise en œuvre des pratiques de sécurité de base

Introduction aux outils de gouvernance des données (Apache Atlas)

Surveillance et journalisation

Configuration des outils de surveillance (Prometheus, Grafana)

Agrégation et surveillance des journaux avec la pile ELK (Elasticsearch, Logstash, Kibana)

Déploiement et tests

Construction d'un prototype de lac de données sur une machine locale

Effectuer des tests et une validation des données

Études de cas et projets pratiques

Études de cas d'architectures de lacs de données dans le monde réel

Projet de synthèse : Déployer un lac de données natif cloud en utilisant des outils open source sur Kubernetes

Conclusion et tendances futures

Tendances émergentes dans les technologies de données natives cloud

Examiner l'avenir des lacs de données open source

Matières

Business

Ce que vous devez savoir avant Vous commencez

Comment construire un lac de données cloud native avec des technologies open source

30 minutes

Not Specified

Free Video

Aperçu

Programme

Matières

IA pour l'automatisation et la modélisation de la FP&A (planification financière et analyse)

FP&A avec IA : Projet de Fin d'Études

Interprétabilité des LLM - Génération de Descriptions de Caractéristiques SAE - Printemps 2026

CodeCloak : une méthode basée sur DRL pour atténuer les fuites de code par les assistants de code LLM

IA générative pour le TALN avec PyTorch

Ingénieur en apprentissage automatique : Modèles d'apprentissage automatique et profond

Ce que vous devez savoir avant
Vous commencez