Prenez contact avec nous

Plan du cours

Introduction à Apache Iceberg

  • Vue d'ensemble d'Apache Iceberg
  • Rappel des concepts de base

Analyse approfondie de l'architecture d'Iceberg

  • Analyse détaillée du format de table d'Iceberg
  • Vue d'ensemble détaillée de l'architecture, incluant les métadonnées et la disposition des fichiers
  • Interne de l'évolution du schéma et des partitions

Installation et configuration avancées

  • Configuration d'Iceberg pour une performance optimale dans différents environnements
  • Intégration avec divers moteurs de traitement de données
  • Configuration avancée : sécurité, chiffrement et contrôles d'accès
  • Mise en place d'Iceberg dans un environnement distribué

Opérations et maintenance avancées

  • Gestion des tables Iceberg à grande échelle
  • Mise en œuvre et gestion de modifications de schéma complexes
  • Gestion de l'évolution des partitions et de la partitionnalité cachée
  • Opérations CRUD avancées avec modifications de schéma et de partitions

Techniques d'optimisation des requêtes

  • Techniques de réduction de la latence des requêtes
  • Réduction des partitions et des fichiers (partition/file pruning)
  • Mise en cache des métadonnées et stratégies d'optimisation
  • Mise en œuvre et test des techniques d'optimisation des requêtes

Réglage des performances pour les grands ensembles de données

  • Optimisation des performances pour les ensembles de données à grande échelle
  • Utilisation des fonctionnalités intégrées d'Iceberg pour le réglage des performances
  • Études de cas sur le réglage des performances dans des scénarios réels
  • Réglage des performances pour les ensembles de données à grande échelle

Migration et intégration des données avancées

  • Migration de structures de données complexes depuis d'autres systèmes
  • Intégration d'Iceberg avec des flux de données en temps réel
  • Migration d'ensembles de données complexes et intégration de flux de données en temps réel

Fiabilité et cohérence

  • Garantie de la cohérence et de l'intégrité des données dans les environnements distribués
  • Mise en œuvre et gestion des garanties transactionnelles
  • Gestion des défaillances et des mécanismes de récupération
  • Mise en œuvre des fonctionnalités de fiabilité et de cohérence

Fonctionnalités avancées et personnalisation

  • Implémentations de catalogues personnalisés
  • Extension d'Iceberg avec des fonctionnalités personnalisées
  • Implémentation de catalogues personnalisés et extension des fonctionnalités d'Iceberg

Gouvernance des données et conformité

  • Mise en œuvre des politiques de gouvernance des données
  • Conformité aux réglementations sur les données
  • Gestion des journaux d'audit et de la lignée des données
  • Mise en œuvre des fonctionnalités de gouvernance et de conformité

Résumé et prochaines étapes

Pré requis

  • Familiarité avec les concepts fondamentaux, les opérations de base et la gestion des tables Iceberg.

Public cible

  • Ingénieurs des données
  • Architectes des données
  • Analystes des données
  • Développeurs logiciels
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires