Prenez contact avec nous

Plan du cours

Architecture de Greenplum

  • Traitement parallèle et multiprocesseur symétrique (SMP)
  • Rôles des segments et configuration du cluster
  • Évolutivité et déplacement des données
  • Architecture de l'entrepôt de données Greenplum

Structures de tables Greenplum

  • Tables distribuées vs tables assignées aléatoirement
  • Tables Heap vs tables en append-only
  • Formats de stockage en rangée vs en colonne
  • Tables partitionnées et clusterisées

Distribution des données et hachage

  • Logique de hachage et clés de distribution
  • Gestion de l'asymétrie (skew) et impact sur les performances
  • Cartes de hachage et stratégies de placement des lignes

Index et optimisation des performances

  • Index clusterisés et non clusterisés
  • Cas d'utilisation des index B-tree et bitmap
  • Comportement du scan d'index et du stockage

Conception physique de la base de données

  • Normalisation et conception du modèle logique
  • Stratégies d'accès utilisateur et analyse de la distribution
  • Démographie des données et décisions d'indexation

Techniques de dénormalisation

  • Données dérivées, tables de résumé et jointures précalculées (pre-joins)
  • Tables en colonnes comme partitionnement vertical
  • Data marts et vues matérialisées

SQL avancé et exécution des requêtes

  • Stratégies de jointure et redistribution
  • Fonctions OLAP et de fenêtrage
  • Tables temporaires, sous-requêtes et tables dérivées

Plans EXPLAIN et réglage des requêtes

  • Lecture et interprétation de la sortie EXPLAIN
  • Analyse des coûts et optimisation des plans
  • Déplacement des jointures et opérations locales aux segments

Utilitaires Greenplum et meilleures pratiques

  • ANALYZE et VACUUM
  • Chargement et déplacement des données avec Nexus
  • Sécurité, permissions et conseils de performance

Résumé et prochaines étapes

Pré requis

  • Une compréhension des bases de données relationnelles et de SQL
  • Une expérience avec les entrepôts de données ou les systèmes analytiques
  • Une familiarité avec les opérations en ligne de commande sous Linux

Public visé

  • Architectes et ingénieurs de données
  • Administrateurs de bases de données et chefs techniques
  • Développeurs BI et spécialistes de l'analyse travaillant avec Greenplum
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires