Formation Apache Spark Fundamentals

Apache Spark est un moteur d'analyse conçu pour distribuer les données à travers un groupe afin de les traiter en parallèle. Il contient des modules pour le streaming, SQL, l'apprentissage automatique et le traitement graphique.

Cette formation guidée par les instructeurs, en direct (online ou sur site) est destinée aux ingénieurs qui souhaitent déployer Apache Spark un système pour le traitement de très grandes quantités de données.

À la fin de cette formation, les participants seront en mesure de :

Installer et configurer Apache Spark.
Comprendre la différence entre Apache Spark et Hadoop MapReduce et quand utiliser qui.
Lisez rapidement dans et analysez des ensembles de données très grands.
Intégrer Apache Spark avec d'autres outils d'apprentissage automatique.

Le format du cours

Lecture et discussion interactives.
Beaucoup d’exercices et de pratiques.
La mise en œuvre dans un environnement de laboratoire en direct.

Options de personnalisation de cours

Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Plan du cours

Introduction

Apache Spark vs Hadoop MapReduce

Vue d'ensemble des caractéristiques et de l'architecture de Apache Spark.

Choix d'une langue Programming

Mise en place Apache Spark

Création d'un exemple d'application

Choix de l'ensemble des données

Exécution Data Analysis sur les données

Traitement des données structurées avec Spark SQL

Traitement des données en continu avec Spark Streaming

Intégration d'Apache Spark avec les outils de la 3ème partie Machine Learning.

Utilisation de Apache Spark pour le traitement graphique

Optimiser Apache Spark

Dépannage

Résumé et conclusion

Pré requis

Expérience de la ligne de commande Linux
Compréhension générale du traitement des données
Expérience de la programmation avec Java, Scala, Python ou R

Audience

Développeurs

21 heures

Nos Clients témoignent (2)

Engagement et volonté de clarifier les sujets secondaires.

Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Formation - Apache Spark Fundamentals

Traduction automatique

L'expérience pratique du formateur, qui ne colore pas la solution discutée mais n'introduit pas non plus de préjugés négatifs. J'ai le sentiment que le formateur me prépare à l'utilisation réelle et pratique de l'outil - ces détails précieux ne se trouvent généralement pas dans les livres.

Krzysztof Miodek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Formation - Apache Spark Fundamentals

Traduction automatique

Formation Apache Spark Fundamentals

Plan du cours

Pré requis

Nos Clients témoignent (2)

Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Formation - Apache Spark Fundamentals

Krzysztof Miodek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Formation - Apache Spark Fundamentals

Cours Similaires

Python and Spark for Big Data (PySpark)

Introduction to Graph Computing

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

Apache Spark MLlib

Big Data Analytics in Health

Hadoop and Spark for Administrators

Hortonworks Data Platform (HDP) for Administrators

A Practical Introduction to Stream Processing

Magellan: Geospatial Analytics on Spark

Apache Spark for .NET Developers

SMACK Stack for Data Science

Administration of Apache Spark

Apache Spark in the Cloud

Spark for Developers

Scaling Data Pipelines with Spark NLP

Catégories Similaires

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Formation Apache Spark Fundamentals

Plan du cours

Pré requis

Nos Clients témoignent (2)

Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Formation - Apache Spark Fundamentals

Krzysztof Miodek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.

Formation - Apache Spark Fundamentals

Cours Similaires

Python and Spark for Big Data (PySpark)

Introduction to Graph Computing

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

Apache Spark MLlib

Big Data Analytics in Health

Hadoop and Spark for Administrators

Hortonworks Data Platform (HDP) for Administrators

A Practical Introduction to Stream Processing

Magellan: Geospatial Analytics on Spark

Apache Spark for .NET Developers

SMACK Stack for Data Science

Administration of Apache Spark

Apache Spark in the Cloud

Spark for Developers

OBJECTIF:

PUBLIC :

Scaling Data Pipelines with Spark NLP

Catégories Similaires

Apache Spark

Ce site dans d'autres pays/régions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites