What You Need to Know Before
You Start

Starts 21 June 2025 00:14

Ends 21 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Introduction complète à PySpark & Google Colab pour la science des données

Développer des modèles pratiques d'apprentissage automatique et de réseaux neuronaux avec PySpark et Google Colab
via Udemy

4120 Cours


4 hours 23 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Paid Course

Optional upgrade avallable

Aperçu

Développez des modèles pratiques d'apprentissage automatique et de réseaux neuronaux avec PySpark et Google Colab Ce que vous apprendrez :

Commencer avec Google Colab - Un environnement cloud puissant alimenté par GPU pour l'IA en Python Se familiariser avec PySpark - Ses utilisations et son fonctionnement Travailler avec PySpark dans l'environnement Google Colab Effectuer le traitement de données à l'aide de PySpark Mettre en œuvre des analyses statistiques courantes à l'aide de PySpark Mettre en œuvre des techniques courantes d'apprentissage automatique - Classification et régression sur des données réelles Implémenter des modèles d'apprentissage profond avec PySpark VOTRE GUIDE COMPLET POUR PYSPARK ET GOOGLE COLAB :

CADRE PUISSANT POUR L'INTELLIGENCE ARTIFICIELLE (IA) Ce cours couvre les principaux aspects de l'écosystème des Big Data de PySpark dans le cadre de Google Colab. Si vous suivez ce cours, vous pouvez éviter de suivre d'autres cours ou d'acheter des livres sur l'analyse basée sur PySpark, car mon cours contient les informations et la syntaxe les plus récentes.

De plus, vous apprenez à canaliser la puissance de PySpark au sein d'un cadre Python IA puissant - Google Colab. À l'ère des Big Data, les entreprises du monde entier utilisent PySpark pour trier l'avalanche d'informations à leur disposition, grâce aux Big Data.

En devenant compétent en apprentissage automatique, réseaux neuronaux et deep learning via un cadre puissant, H2O en Python, vous pouvez donner à votre entreprise un avantage concurrentiel et propulser votre carrière au niveau supérieur ! APPRENEZ D'UN EXPERT EN DATA SCIENCE :

Mon nom est Minerva Singh et je suis diplômée d'un MPhil de l'Université d'Oxford (Géographie et Environnement).

J'ai terminé un doctorat à l'Université de Cambridge, au Royaume-Uni, où je me suis spécialisée dans les modèles de data science. J'ai plus de 5 ans d'expérience dans l'analyse de données réelles de différentes sources en utilisant des techniques liées à la data science et j'ai produit des publications pour des revues internationales à comité de lecture.

Au cours de mes recherches, j'ai réalisé que presque tous les cours et livres sur la data science ne prennent pas en compte la nature multidimensionnelle du sujet. Ce cours vous donnera une base solide sur les principaux aspects du travail avec PySpark - votre passerelle vers les Big Data.

Contrairement à d'autres instructeurs, je plonge profondément dans les fonctionnalités de data science de PySpark et leur mise en œuvre via Google Colab et vous offre une base unique. Vous irez de la lecture et du nettoyage des données à l'implémentation d'algorithmes puissants d'apprentissage automatique et de réseaux neuronaux et à l'évaluation de leurs performances en utilisant PySpark.

Parmi d'autres choses :

Vous serez introduit à Google Colab, un cadre puissant pour mettre en œuvre la data science via votre navigateur. Vous serez initié aux concepts importants de l'apprentissage automatique sans jargon.

Apprenez à installer PySpark dans l'environnement Colab et à l'utiliser pour travailler avec des données Vous apprendrez à implémenter des algorithmes supervisés et non supervisés en utilisant le cadre PySpark Implémentez à la fois des réseaux neuronaux artificiels (ANN) et des réseaux neuronaux profonds (DNN) avec le cadre PySpark Travaillez avec des données réelles à l'intérieur du cadre AUCUNE CONNAISSANCE PRÉALABLE EN PYTHON OU EN STATISTIQUES / APPRENTISSAGE AUTOMATIQUE OU BIG DATA N'EST NÉCESSAIRE :

Vous commencerez par absorber les bases et techniques les plus précieuses de la Data Science avec PySpark. J'utilise des méthodes pratiques et faciles à comprendre pour simplifier et aborder même les concepts les plus difficiles en Python.

Mon cours vous aidera à implémenter les méthodes en utilisant des données réelles provenant de différentes sources. De nombreux cours utilisent des données fictives qui n'encouragent pas les étudiants à mettre en œuvre la data science basée sur PySpark dans la vie réelle.

Après avoir suivi ce cours, vous utiliserez facilement les dernières techniques de PySpark pour mettre en œuvre des techniques de data science novatrices directement depuis votre navigateur. Vous vous salirez les mains avec des données et des problèmes réels.

Vous comprendrez même les concepts sous-jacents pour savoir quels algorithmes et méthodes conviennent le mieux à vos données. Nous travaillerons également avec des données réelles et vous aurez accès à tout le code et aux données utilisés dans le cours.

JOIGNEZ-VOUS À MON COURS MAINTENANT ! JE SUIS LÀ POUR VOUS SOUTENIR TOUT AU LONG DE VOTRE PARCOURS EN CAS DE NON-SATISFACTION, IL Y A UNE GARANTIE DE REMBOURSEMENT DE 30 JOURS SANS QUESTION.

Programme

  • Introduction au cours
  • Aperçu de PySpark
    Aperçu de Google Colab
    Objectifs et structure du cours
  • Configuration de votre environnement
  • Installation de PySpark
    Introduction à Google Colab
    Intégration de PySpark avec Google Colab
  • Comprendre PySpark
  • Architecture de PySpark
    Jeux de données distribués résilients (RDD)
    Transformations et actions
  • Travailler avec les DataFrames et SQL
  • Création de DataFrames
    Opérations sur les DataFrames
    Requêtes SQL dans PySpark
  • Techniques avancées de PySpark
  • Travailler avec PySpark MLlib pour l'apprentissage automatique
    Utiliser PySpark Streaming pour les données en temps réel
    Traitement de graphes avec GraphFrames
  • Gérer les Big Data dans PySpark
  • Partitionnement et réorganisation dans PySpark
    Optimisation des performances de PySpark
    Meilleures pratiques pour le traitement des Big Data
  • Explorer les fonctionnalités de Google Colab
  • Utilisation de GPU et TPU dans Colab
    Collaboration en temps réel
    Intégration de Google Drive avec Colab
  • Construire des modèles d'IA avec PySpark et Colab
  • Prétraitement des données pour les modèles d'IA
    Entraînement et évaluation des modèles d'apprentissage automatique
    Déploiement de modèles PySpark dans Colab
  • Projets réels
  • Projet 1 : Construction d'un pipeline de données PySpark
    Projet 2 : Analyse de données en temps réel avec PySpark Streaming
    Projet 3 : Entraîner un modèle d'IA à l'échelle avec PySpark sur Colab
  • Conclusion du cours
  • Récapitulatif des concepts clés
    Ressources supplémentaires et prochaines étapes
    Session finale de questions-réponses
  • Évaluations et projet final
  • Quiz hebdomadaires
    Projet de synthèse : Solution de science des données de bout en bout utilisant PySpark et Colab

Enseigné par

Minerva Singh


Sujets

Programmation