Plan du cours
Introduction à la plateforme Stratio
- Aperçu de l'architecture et des modules principaux de Stratio
- Rôle de Rocket et Intelligence dans le cycle de vie des données
- Connexion et navigation dans l'interface utilisateur de Stratio
Travailler avec le module Rocket
- Ingestion de données et création de pipelines
- Connexion des sources de données et configuration des transformations
- Utilisation de PySpark pour les tâches de prétraitement dans Rocket
Essentiels de PySpark pour les utilisateurs de Stratio
- Structures de données et opérations en PySpark
- Constructions de boucles : utilisation de for, while, if/else
- Écriture de fonctions personnalisées avec def et leur application
Utilisation avancée de Rocket avec PySpark
- Ingestion et transformations en streaming
- Utilisation de boucles et de fonctions dans des scénarios batch et temps réel
- Bonnes pratiques pour l'optimisation des performances dans les pipelines PySpark
Exploration du module Intelligence
- Aperçu des fonctionnalités de modélisation et d'analyse des données
- Sélection, transformation et exploration des caractéristiques
- Rôle de PySpark dans l'analyse personnalisée et les insights
Construction de flux de travail d'analyse avancés
- Création de fonctions définies par l'utilisateur (UDFs) dans Intelligence
- Application des conditionnels et boucles pour la logique de données
- Cas d'utilisation : segmentation, agrégation et prédiction
Déploiement et collaboration
- Sauvegarde, exportation et réutilisation des flux de travail
- Collaboration avec d'autres membres de l'équipe sur Stratio
- Revue des résultats et intégration avec les outils downstream
Résumé et prochaines étapes
Pré requis
- Expérience en programmation Python
- Compréhension des concepts d'analyse de données ou de traitement du big data
- Connaissances de base d'Apache Spark et du calcul distribué
Audience
- Ingénieurs des données travaillant sur des plateformes basées sur Stratio
- Analystes ou développeurs utilisant les modules Rocket et Intelligence
- Équipes techniques en transition vers des flux de travail PySpark au sein de Stratio
Nos clients témoignent (4)
Les exemples pratiques nous ont permis de ressentir réellement comment le programme fonctionne. Des explications détaillées et une intégration des concepts théoriques et leur relation avec les applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique
Tous les sujets qu'il a abordés, y compris des exemples. Et également expliqué comment ils sont utiles dans notre travail quotidien.
madduri madduri - Boskalis Singapore Pte Ltd
Formation - QGIS for Geographic Information System
Traduction automatique
J'ai vraiment apprécié la formation. J'ai trouvé tous les modules applicables aux problèmes que je cherche à résoudre au travail. L'intégration de la formation avec les carnets Jupyter était vraiment impressionnante.
Mark Firmin - Environment and Climate Change Canada
Formation - Python for Geographic Information System (GIS)
Traduction automatique
La chose que j'ai le plus aimée dans la formation était l'organisation et l'emplacement
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Formation - ArcGIS for Spatial Analysis
Traduction automatique