Plan du cours
Introduction aux Google Colab et Apache Spark
- Aperçu de Google Colab
- Introduction à Apache Spark
- Configuration de Spark dans Google Colab
Traitement des données avec Apache Spark
- Travail avec RDDs et DataFrames
- Chargement et traitement de grands ensembles de données
- Utilisation de Spark SQL pour interroger des données structurées
Analyse avancée avec Spark
- Apprentissage automatique avec Spark MLlib
- Réalisation d'analyses de données en temps réel
- Calcul distribué avec Spark
Visualisation et Collaboration dans Google Colab
- Intégration de Colab avec des bibliothèques de visualisation populaires
- Travaux collaboratifs avec les notebooks Colab
- Partage et exportation des résultats
Optimisation des workflows Big Data
- Paramétrage de Spark pour la performance
- Optimisation de l'utilisation de la mémoire et du stockage
- Échelonnement des workflows pour les grands ensembles de données
Big Data dans le Cloud
- Intégration de Google Colab avec des outils basés sur le cloud
- Utilisation du stockage en nuage pour les grands volumes de données
- Travail avec Spark dans des environnements distribués en nuage
Études de cas et meilleures pratiques
- Revue d'applications réelles de grands volumes de données
- Études de cas utilisant Apache Spark et Colab
- Meilleures pratiques pour l'analyse des grands ensembles de données
Résumé et prochaines étapes
Pré requis
- Connaissance de base des concepts en science des données
- Familiarité avec Apache Spark
- Compétences en programmation Python
Public cible
- Scientifiques des données
- Ingénieurs de données
- Chercheurs travaillant avec de grandes masses de données
Nos clients témoignent (5)
Les exemples pratiques nous ont permis de ressentir réellement comment le programme fonctionne. Des explications détaillées et une intégration des concepts théoriques et leur relation avec les applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique
Tous les sujets qu'il a abordés, y compris des exemples. Et également expliqué comment ils sont utiles dans notre travail quotidien.
madduri madduri - Boskalis Singapore Pte Ltd
Formation - QGIS for Geographic Information System
Traduction automatique
J'ai aimé le style de Pablo, le fait qu'il couvre beaucoup de sujets, de la conception de rapports, la personnalisation avec html à l'implémentation d'algortithmes ML simples. [L'équilibre entre les informations théoriques et les exercices. Pablo a vraiment couvert tous les sujets qui m'intéressaient et a donné des réponses complètes à mes questions.
Cristian Tudose - SC Automobile Dacia SA
Formation - Advanced Data Analysis with TIBCO Spotfire
Traduction automatique
Application pratique de Spotfire et toutes les fonctions de base.
Michael Capili - STMicroelectronics, Inc.
Formation - Introduction to Spotfire
Traduction automatique
La chose que j'ai le plus aimée dans la formation était l'organisation et l'emplacement
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Formation - ArcGIS for Spatial Analysis
Traduction automatique