Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Fondements du Data Warehousing
- Objectif, composants et architecture de l'entrepôt de données
- Data marts, entrepôts d'entreprise et modèles lakehouse
- Principes fondamentaux de l'OLTP vs OLAP et séparation des charges de travail
Modélisation dimensionnelle
- Faits, dimensions et grain
- Schéma étoile vs schéma flocon de neige
- Types de dimensions évoluant lentement et gestion
Processus ETL et ELT
- Stratégies d'extraction à partir de l'OLTP et des API
- Transformations, nettoyage des données et conformité
- Modèles de chargement, orchestration et gestion des dépendances
Gestion de la qualité des données et de la métadonnées
- Profilage des données et règles de validation
- Alignement des données maîtres et de référence
- Lignée, catalogues et documentation
Analyse et performance
- Concepts de cubage, agrégats et vues matérialisées
- Partitionnement, clustering et indexation pour l'analyse
- Gestion des charges de travail, mise en cache et optimisation des requêtes
Sécurité et gouvernance
- Contrôle d'accès, rôles et sécurité au niveau des lignes
- Considérations de conformité et audit
- Pratiques de sauvegarde, récupération et fiabilité
Architectures modernes
- Entrepôts de données cloud et élasticité
- Ingestion en flux et analyse quasi temps réel
- Optimisation des coûts et monitoring
Projet final : Du source au schéma étoile
- Modélisation d'un processus métier en faits et dimensions
- Construction d'un workflow ETL ou ELT complet
- Publication de tableaux de bord et validation des métriques
Résumé et étapes suivantes
Pré requis
- Une compréhension des bases de données relationnelles et du SQL
- Une expérience en analyse de données ou en reporting
- Une familiarité de base avec des plateformes de données dans le cloud ou sur site
Audience
- Analystes de données en transition vers le data warehousing
- Développeurs BI et ingénieurs ETL
- Architectes de données et responsables d'équipe
35 Heures
Nos clients témoignent (5)
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique