What You Need to Know Before
You Start

Starts 6 June 2025 14:49

Ends 6 June 2025

00 days
00 hours
00 minutes
00 seconds
course image

Guía Completa de PySpark y Google Colab para Ciencia de Datos

Desarrolla Modelos Prácticos de Aprendizaje Automático y Redes Neuronales con PySpark y Google Colab
via Udemy

4052 Cursos


4 hours 23 minutes

Optional upgrade avallable

Not Specified

Progress at your own speed

Paid Course

Optional upgrade avallable

Resumen

Desarrolla Modelos Prácticos de Aprendizaje Automático y Redes Neuronales con PySpark y Google Colab Lo que aprenderás:

Comienza con Google Colab, un potente entorno basado en la nube con GPU para Python AI Familiarízate con PySpark, sus usos y funcionamiento Trabaja con PySpark dentro del entorno de Google Colab Realiza el procesamiento de datos utilizando PySpark Implementa análisis estadísticos comunes con PySpark Implementa técnicas comunes de aprendizaje automático, clasificación y regresión en datos reales Implementa modelos de aprendizaje profundo dentro de PySpark TU GUÍA COMPLETA SOBRE PYSPARK Y GOOGLE COLAB:

UN MARCO PODEROSO PARA LA INTELIGENCIA ARTIFICIAL (IA) Este curso cubre los aspectos principales del ecosistema de Big Data PySpark dentro del marco de Google Colab. Si tomas este curso, podrás prescindir de tomar otros cursos o comprar libros sobre análisis basado en PySpark, ya que mi curso tiene la información y sintaxis más actualizada.

Además, aprenderás a canalizar el poder de PySpark dentro de un potente marco de Python para IA, Google Colab. En esta era de big data, las empresas de todo el mundo usan PySpark para filtrar la avalancha de información a su disposición, cortesía del Big Data.

Al volverte competente en aprendizaje automático, redes neuronales y aprendizaje profundo a través de un marco poderoso, H2O en Python, podrás darle a tu empresa una ventaja competitiva y llevar tu carrera al siguiente nivel. APRENDE DE UNA EXPERTA CIENTÍFICA DE DATOS:

Mi nombre es Minerva Singh y soy una graduada de MPhil (Geografía y Medio Ambiente) de la Universidad de Oxford.

Terminé un doctorado en la Universidad de Cambridge, Reino Unido, donde me especialicé en modelos de ciencia de datos. Tengo más de 5 años de experiencia analizando datos reales de diferentes fuentes usando técnicas relacionadas con la ciencia de datos y produciendo publicaciones para revistas internacionales revisadas por pares.

Durante mi investigación, me di cuenta de que casi todos los cursos y libros de ciencia de datos que existen no tienen en cuenta la naturaleza multidimensional del tema. Este curso te dará una base sólida en los aspectos principales de trabajar con PySpark, tu puerta de entrada al Big Data.

A diferencia de otros instructores, profundizo en las características de ciencia de datos de PySpark y su implementación a través de Google Colab, y te doy una base única. Irás desde la lectura y limpieza de datos hasta finalmente implementar algoritmos poderosos de aprendizaje automático y redes neuronales y evaluar su rendimiento utilizando PySpark.

Entre otras cosas:

Serás introducido a Google Colab, un poderoso marco para implementar ciencia de datos a través de tu navegador. Se te presentarán conceptos importantes del aprendizaje automático sin jerga.

Aprende a instalar PySpark dentro del entorno Colab y úsalo para trabajar con datos Aprenderás a implementar tanto algoritmos supervisados como no supervisados usando el marco PySpark Implementa tanto redes neuronales artificiales (ANN) como redes neuronales profundas (DNN) con el marco PySpark Trabaja con datos reales dentro del marco NO SE REQUIEREN CONOCIMIENTOS PREVIOS DE PYTHON, ESTADÍSTICA/APRENDIZAJE AUTOMÁTICO O BIG DATA:

Comenzarás por absorber los conceptos y técnicas más valiosos de la Ciencia de Datos con PySpark. Utilizo métodos prácticos y fáciles de entender para simplificar y abordar incluso los conceptos más difíciles en Python.

Mi curso te ayudará a implementar los métodos usando datos reales obtenidos de diferentes fuentes. Muchos cursos usan datos inventados que no empoderan a los estudiantes para implementar ciencia de datos basada en PySpark en la vida real.

Después de tomar este curso, usarás fácilmente las técnicas más recientes de PySpark para implementar nuevas técnicas de ciencia de datos directamente desde tu navegador. Ensuciarás tus manos con datos y problemas reales.

Incluso entenderás los conceptos subyacentes para comprender qué algoritmos y métodos son los más adecuados para tus datos. También trabajaremos con datos reales y tendrás acceso a todo el código y datos utilizados en el curso.

¡ÚNETE A MI CURSO AHORA! ESTOY AQUÍ PARA APOYARTE A LO LARGO DE TU VIAJE EN CASO DE QUE NO ESTÉS SATISFECHO, HAY UNA GARANTÍA DE DEVOLUCIÓN DE DINERO SIN DISCUSIÓN POR 30 DÍAS.

Programa de estudio

  • Introducción al Curso
  • Resumen de PySpark
    Resumen de Google Colab
    Objetivos y estructura del curso
  • Configuración de tu Entorno
  • Instalación de PySpark
    Introducción a Google Colab
    Integración de PySpark con Google Colab
  • Entendiendo PySpark
  • Arquitectura de PySpark
    Conjuntos de Datos Distribuidos Resilientes (RDDs)
    Transformaciones y Acciones
  • Trabajo con DataFrames y SQL
  • Creación de DataFrames
    Operaciones con DataFrames
    Consultas SQL en PySpark
  • Técnicas Avanzadas de PySpark
  • Uso de PySpark MLlib para Aprendizaje Automático
    Uso de PySpark Streaming para Datos en Tiempo Real
    Procesamiento de Grafos con GraphFrames
  • Manejo de Big Data en PySpark
  • Particionamiento y Reorganización en PySpark
    Optimización del Rendimiento de PySpark
    Mejores Prácticas para el Procesamiento de Big Data
  • Explorando las Características de Google Colab
  • Uso de GPUs y TPUs en Colab
    Colaboración en Tiempo Real
    Integración de Google Drive con Colab
  • Creación de Modelos de IA con PySpark y Colab
  • Preprocesamiento de Datos para Modelos de IA
    Entrenamiento y Evaluación de Modelos de Aprendizaje Automático
    Despliegue de Modelos PySpark en Colab
  • Proyectos del Mundo Real
  • Proyecto 1: Creación de una Canalización de Datos con PySpark
    Proyecto 2: Análisis de Datos en Tiempo Real con PySpark Streaming
    Proyecto 3: Entrenamiento Escalable de un Modelo de IA con PySpark en Colab
  • Conclusión del Curso
  • Resumen de Conceptos Clave
    Recursos Adicionales y Próximos Pasos
    Sesión Final de Preguntas y Respuestas
  • Evaluaciones y Proyecto Final
  • Cuestionarios Semanales
    Proyecto Final: Solución Completa de Ciencia de Datos Usando PySpark y Colab

Enseñado por

Minerva Singh


Asignaturas

Programación