Prenez contact avec nous

Plan du cours

Introduction

  • Aperçu des fonctionnalités et de l'architecture de Spark et Hadoop
  • Compréhension des données massives
  • Bases de la programmation Python

Premiers pas

  • Mise en place de Python, Spark et Hadoop
  • Compréhension des structures de données en Python
  • Compréhension de l'API PySpark
  • Compréhension de HDFS et MapReduce

Intégration de Spark et Hadoop avec Python

  • Mise en œuvre des RDD Spark en Python
  • Traitement des données à l'aide de MapReduce
  • Création de jeux de données distribués dans HDFS

Apprentissage automatique avec Spark MLlib

Traitement des données massives avec Spark Streaming

Travail avec des systèmes de recommandation

Travail avec Kafka, Sqoop, Kafka et Flume

Apache Mahout avec Spark et Hadoop

Dépannage

Résumé et prochaines étapes

Pré requis

  • Expérience avec Spark et Hadoop
  • Expérience en programmation Python

Audience cible

  • Scientifiques des données
  • Développeurs
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires