Formation Python and Spark for Big Data (PySpark)

Python est un langage de programmation de haut niveau réputé pour sa syntaxe claire et sa lisibilité du code. Spark est un moteur de traitement de données utilisé pour interroger, analyser et transformer le Big Data. PySpark permet aux utilisateurs d’interfacer Spark avec Python .

Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Python et Spark ensemble pour analyser des données volumineuses au cours d’exercices pratiques.

À la fin de cette formation, les participants seront en mesure de:

Apprenez à utiliser Spark avec Python pour analyser des Big Data .
Travaillez sur des exercices qui imitent les circonstances réelles.
Utilisez différents outils et techniques d'analyse de données PySpark aide de PySpark .

Format du cours

Partie de conférence, partie de discussion, exercices et exercices intensifs

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Plan du cours

Introduction

Comprendre Big Data

Aperçu de Spark

Vue d'ensemble de Python

Vue d'ensemble de PySpark

Distribuer des données à l'aide de la structure de données distribuées résilientes (Resilient Distributed Datasets Framework)
Distribuer des calculs à l'aide des opérateurs de l'API Spark

Configurer Python avec Spark

Configuration PySpark

Utiliser Amazon Web Services (AWS) Instances EC2 pour Spark

Mise en place Databricks

Configuration du cluster AWS EMR

Apprendre les bases de Python Programming

Démarrer avec Python
Utiliser le bloc-notes Jupyter
Utiliser des variables et des types de données simples
Travailler avec des listes
Utilisation des instructions if
Utilisation des entrées utilisateur
Travailler avec des boucles while
Implémentation de fonctions
Travailler avec des classes
Travailler avec des fichiers et des exceptions
Travailler avec des projets, des données et des API

Apprendre les bases de Spark DataFrame

Démarrer avec les DataFrames Spark
Implémenter des opérations de base avec Spark
Utiliser les opérations Groupby et Aggregate
Travailler avec des horodatages et des dates

Travailler sur un projet Spark DataFrame Exercice

Comprendre Machine Learning avec MLlib

Travailler avec MLlib, Spark et Python pour Machine Learning

Comprendre les régressions

Apprendre la théorie de la régression linéaire
Implémenter un code d'évaluation de régression
Travailler sur un exemple d'exercice de régression linéaire
Apprendre la théorie de la régression logistique
Implémentation d'un code de régression logistique
Travailler sur un exemple d'exercice de régression logistique

Comprendre les Random Forest et les arbres de décision

Apprendre la théorie des méthodes d'arbres
Implémentation des arbres de décision et des codes Random Forest
Travailler sur un exemple d'exercice de classification Random Forest

Travailler avec le regroupement K-means

Comprendre la théorie du regroupement K-means
Implémentation d'un code de clustering K-means
Travailler sur un exemple d'exercice de clustering

Travailler avec les systèmes de recommandation

Implémentation du traitement du langage naturel

Comprendre Natural Language Processing (NLP)
Vue d'ensemble des outils de traitement du langage naturel
Travailler sur un exemple d'exercice de NLP

Streaming avec Spark sur Python

Vue d'ensemble du streaming avec Spark
Exemple d'exercice Spark Streaming

Remarques finales

Pré requis

Compétence générale en programmation

Public

Développeurs
Professionnels de l'informatique
Data Scientists

21 heures

Nos Clients témoignent (2)

I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.

Aurelia-Adriana - Allianz Services Romania

Formation - Python and Spark for Big Data (PySpark)

The course was about a series of very complex related topics & Pablo has in-depth expertise of each of them. Sometimes nuances were lost in communication and/or due to time pressures and possibly expectations were not quite met due to this. Also there were some UHG/Azure Databricks setup issues however Pablo / UHG resolved these quickly once they became apparent - this to me showed a high level of understanding and professionalism between UHG & Pablo,

Formation Python and Spark for Big Data (PySpark)

Plan du cours

Pré requis

Nos Clients témoignent (2)

Aurelia-Adriana - Allianz Services Romania

Formation - Python and Spark for Big Data (PySpark)

Michael Monks - Tech NorthWest Skillnet

Formation - Python and Spark for Big Data (PySpark)

Cours Similaires

Data Analysis with Python, Pandas and Numpy

Accelerating Python Pandas Workflows with Modin

Machine Learning with Python and Pandas

Scaling Data Analysis with Python and Dask

FARM (FastAPI, React, and MongoDB) Full Stack Development

Developing APIs with Python and FastAPI

Scientific Computing with Python SciPy

Game Development with PyGame

Web application development with Flask

Advanced Flask

Build REST APIs with Python and Flask

GUI Programming with Python and Tkinter

Kivy: Building Android Apps with Python

GUI Programming with Python and PyQt

Web Development with Web2Py

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites