Plan du cours
Introduction
- Aperçu des fonctionnalités et de l'architecture de Spark et Hadoop
- Compréhension des données massives
- Bases de la programmation Python
Premiers pas
- Mise en place de Python, Spark et Hadoop
- Compréhension des structures de données en Python
- Compréhension de l'API PySpark
- Compréhension de HDFS et MapReduce
Intégration de Spark et Hadoop avec Python
- Mise en œuvre des RDD Spark en Python
- Traitement des données à l'aide de MapReduce
- Création de jeux de données distribués dans HDFS
Apprentissage automatique avec Spark MLlib
Traitement des données massives avec Spark Streaming
Travail avec des systèmes de recommandation
Travail avec Kafka, Sqoop, Kafka et Flume
Apache Mahout avec Spark et Hadoop
Dépannage
Résumé et prochaines étapes
Pré requis
- Expérience avec Spark et Hadoop
- Expérience en programmation Python
Audience cible
- Scientifiques des données
- Développeurs
Nos clients témoignent (3)
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
J'ai aimé qu'il arrive à poser les bases du sujet et à aborder des exercices assez avancés. Il a également fourni des méthodes simples pour écrire et tester le code.
Ionut Goga - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique