Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Architecture de Greenplum
- Traitement parallèle et multiprocesseur symétrique (SMP)
- Rôles des segments et configuration du cluster
- Évolutivité et déplacement des données
- Architecture de l'entrepôt de données Greenplum
Structures de tables Greenplum
- Tables distribuées vs tables assignées aléatoirement
- Tables Heap vs tables en append-only
- Formats de stockage en rangée vs en colonne
- Tables partitionnées et clusterisées
Distribution des données et hachage
- Logique de hachage et clés de distribution
- Gestion de l'asymétrie (skew) et impact sur les performances
- Cartes de hachage et stratégies de placement des lignes
Index et optimisation des performances
- Index clusterisés et non clusterisés
- Cas d'utilisation des index B-tree et bitmap
- Comportement du scan d'index et du stockage
Conception physique de la base de données
- Normalisation et conception du modèle logique
- Stratégies d'accès utilisateur et analyse de la distribution
- Démographie des données et décisions d'indexation
Techniques de dénormalisation
- Données dérivées, tables de résumé et jointures précalculées (pre-joins)
- Tables en colonnes comme partitionnement vertical
- Data marts et vues matérialisées
SQL avancé et exécution des requêtes
- Stratégies de jointure et redistribution
- Fonctions OLAP et de fenêtrage
- Tables temporaires, sous-requêtes et tables dérivées
Plans EXPLAIN et réglage des requêtes
- Lecture et interprétation de la sortie EXPLAIN
- Analyse des coûts et optimisation des plans
- Déplacement des jointures et opérations locales aux segments
Utilitaires Greenplum et meilleures pratiques
- ANALYZE et VACUUM
- Chargement et déplacement des données avec Nexus
- Sécurité, permissions et conseils de performance
Résumé et prochaines étapes
Pré requis
- Une compréhension des bases de données relationnelles et de SQL
- Une expérience avec les entrepôts de données ou les systèmes analytiques
- Une familiarité avec les opérations en ligne de commande sous Linux
Public visé
- Architectes et ingénieurs de données
- Administrateurs de bases de données et chefs techniques
- Développeurs BI et spécialistes de l'analyse travaillant avec Greenplum
21 Heures
Nos clients témoignent (1)
les pratiques
Liliana Padilla - Hipodromo de Agua Caliente
Formation - Greenplum Architecture and Data Modeling
Traduction automatique