Prenez contact avec nous

Plan du cours

Blocs de construction avancés de transformations

  • Travail avec des types de données complexes
  • Gestion des champs, des métadonnées et des structures dynamiques
  • Modèles de transformations réutilisables

Paramètres, variables et conception orientée tâches (Jobs)

  • Variables d'exécution et portée
  • Paramétrisation des transformations
  • Structures de tâches parent-enfant

Intégration aux bases de données et stratégies de recherche (lookup)

  • Étapes de recherche avancées
  • Stratégies de mise en cache
  • Conceptions de jointures efficaces

Travail avec des fichiers, des API et des systèmes externes

  • Traitement de JSON et XML
  • Appel de services REST et SOAP
  • Chargements en flux continu et par lots

Gestion des erreurs et techniques de qualité des données

  • Captage et routage des erreurs
  • Modèles de validation des données
  • Audit et journalisation

Essentiels de l'optimisation des performances

  • Optimisation de la conception des étapes
  • Considérations relatives à la mémoire et au filage (threading)
  • Détection des goulots d'étranglement

Introduction au développement basé sur le dépôt (Repository)

  • Utilisation du dépôt Pentaho
  • Gestion des versions
  • Pratiques de collaboration en équipe

Pratiques de déploiement et de migration

  • Promotion des tâches entre les environnements
  • Gestion de la configuration
  • Meilleures pratiques opérationnelles

Résumé et prochaines étapes

Pré requis

  • Une compréhension des fondamentaux de l'ETL
  • De l'expérience avec Pentaho Data Integration
  • Des connaissances de base sur les concepts d'entrepôt de données

Public cible

  • Développeurs ETL
  • Ingénieurs de données
  • Professionnels techniques élargissant leurs compétences en PDI
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires