Plan du cours
Introduction
- Apache Spark vs Hadoop MapReduce
Vue d'ensemble des caractéristiques et de l'architecture de Apache Spark.
Choix d'une langue Programming
Mise en place Apache Spark
Création d'un exemple d'application
Choix de l'ensemble des données
Exécution Data Analysis sur les données
Traitement des données structurées avec Spark SQL
Traitement des données en continu avec Spark Streaming
Intégration d'Apache Spark avec les outils de la 3ème partie Machine Learning.
Utilisation de Apache Spark pour le traitement graphique
Optimiser Apache Spark
Dépannage
Résumé et conclusion
Pré requis
- Expérience avec la ligne de commande Linux
- Une compréhension générale du traitement des données
- Expérience de programmation avec Java, Scala, Python ou R
Public cible
- Développeurs
Nos clients témoignent (3)
Les exercices et les échanges lors de questions / réponses
Antoine - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique