Plan du cours
Introduction
Aperçu des approches d'accès aux données (Hive, bases de données, etc.)
Présentation des fonctionnalités et de l'architecture de Spark
Installation et configuration de Spark
Comprendre les dataframes dans Spark
Définir des tables et importer des ensembles de données
Interrogation de trames de données à l'aide de SQL
Réalisation d'agrégations, de JOIN et de requêtes imbriquées
Téléchargement et Accessing de données
Interroger différents types de données
- JSON, Parquet, etc.
Interroger des lacs de données avec SQL
Dépannage
Sommaire et conclusion
Pré requis
- Expérience avec les requêtes SQL
- Expérience de programmation dans n'importe quel langage
Public cible
- Analystes de données
- Scientifiques des données
- Ingénieurs de données
Nos clients témoignent (3)
Les exercices et les échanges lors de questions / réponses
Antoine - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique