Plan du cours

Introduction

  • Apache Spark vs Hadoop MapReduce

Vue d'ensemble des caractéristiques et de l'architecture de Apache Spark.

Choix d'une langue Programming

Mise en place Apache Spark

Création d'un exemple d'application

Choix de l'ensemble des données

Exécution Data Analysis sur les données

Traitement des données structurées avec Spark SQL

Traitement des données en continu avec Spark Streaming

Intégration d'Apache Spark avec les outils de la 3ème partie Machine Learning.

Utilisation de Apache Spark pour le traitement graphique

Optimiser Apache Spark

Dépannage

Résumé et conclusion

Pré requis

  • Expérience de la ligne de commande Linux
  • Compréhension générale du traitement des données
  • Expérience de la programmation avec Java, Scala, Python ou R

Audience

  • Développeurs
 21 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (2)

Cours Similaires

Python and Spark for Big Data (PySpark)

21 heures

Introduction to Graph Computing

28 heures

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 heures

Apache Spark MLlib

35 heures

Big Data Analytics in Health

21 heures

Hadoop and Spark for Administrators

35 heures

Hortonworks Data Platform (HDP) for Administrators

21 heures

A Practical Introduction to Stream Processing

21 heures

Magellan: Geospatial Analytics on Spark

14 heures

Apache Spark for .NET Developers

21 heures

SMACK Stack for Data Science

14 heures

Administration of Apache Spark

35 heures

Apache Spark in the Cloud

21 heures

Spark for Developers

21 heures

Scaling Data Pipelines with Spark NLP

14 heures

Catégories Similaires