Plan du cours
Introduction aux Google Colab et Apache Spark
- Aperçu de Google Colab
- Introduction à Apache Spark
- Configuration de Spark dans Google Colab
Traitement des données avec Apache Spark
- Travail avec RDDs et DataFrames
- Chargement et traitement de grands ensembles de données
- Utilisation de Spark SQL pour interroger des données structurées
Analyse avancée avec Spark
- Apprentissage automatique avec Spark MLlib
- Réalisation d'analyses de données en temps réel
- Calcul distribué avec Spark
Visualisation et Collaboration dans Google Colab
- Intégration de Colab avec des bibliothèques de visualisation populaires
- Travaux collaboratifs avec les notebooks Colab
- Partage et exportation des résultats
Optimisation des workflows Big Data
- Paramétrage de Spark pour la performance
- Optimisation de l'utilisation de la mémoire et du stockage
- Échelonnement des workflows pour les grands ensembles de données
Big Data dans le Cloud
- Intégration de Google Colab avec des outils basés sur le cloud
- Utilisation du stockage en nuage pour les grands volumes de données
- Travail avec Spark dans des environnements distribués en nuage
Études de cas et meilleures pratiques
- Revue d'applications réelles de grands volumes de données
- Études de cas utilisant Apache Spark et Colab
- Meilleures pratiques pour l'analyse des grands ensembles de données
Résumé et prochaines étapes
Pré requis
- Connaissance de base des concepts en science des données
- Familiarité avec Apache Spark
- Compétences en programmation Python
Public cible
- Scientifiques des données
- Ingénieurs de données
- Chercheurs travaillant avec de grandes masses de données
Nos clients témoignent (4)
Des exemples pratiques nous ont permis de ressentir concrètement le fonctionnement du programme. De bonnes explications et une intégration efficace des concepts théoriques et de leur rapport aux applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique
Tous les sujets qu'il a abordés, y compris des exemples. Il a également expliqué comment ils sont utiles dans notre travail quotidien.
madduri madduri - Boskalis Singapore Pte Ltd
Formation - QGIS for Geographic Information System
Traduction automatique
J'ai vraiment apprécié la formation. J'ai trouvé que tous les modules étaient applicables aux problèmes que je tente de résoudre au travail. L'intégration de la formation avec des carnets Jupyter était vraiment impressionnante.
Mark Firmin - Environment and Climate Change Canada
Formation - Python for Geographic Information System (GIS)
Traduction automatique
La chose que j'ai préférée lors de la formation était l'organisation et le lieu
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Formation - ArcGIS for Spatial Analysis
Traduction automatique