Prenez contact avec nous

Plan du cours

Introduction à Teradata

Module 1 : Fondamentaux de Teradata et son architecture

  • Qu'est-ce que Teradata et à quoi sert-il ?
  • Architecture parallèle : AMPs, PEs, BYNET
  • Répartition des données et hachage
  • Concepts clés : sessions, spool, verrous
  • Connexion au système : Teradata Studio / BTEQ / SQL Assistant

Module 2 : Introduction au SQL dans Teradata

  • SELECT de base, WHERE, ORDER BY
  • Types de données et conversion (casting)
  • Fonctions mathématiques et de date
  • Utilisation des ALIAS, expressions CASE
  • Opérateurs spéciaux de Teradata (TOP, QUALIFY, SAMPLE)
  • Pratique guidée : requêtes sur des tables réelles

Module 3 : Joins, Sous-requêtes et opérateurs ensemblistes

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Joins sans clause ON (produit cartésien)
  • Sous-requêtes scalaires et corrélées
  • UNION, INTERSECT, MINUS
  • Exercices pratiques d'intégration de données

Module 4 : Fonctions analytiques et OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Partitionnement des données avec PARTITION BY
  • Fenêtres avec OVER() et ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Cas d'utilisation : indicateurs de performance (KPI), tendances, accumulations

Module 5 : Gestion des données et des tables

  • Types de tables : tables permanentes, volatiles, globales temporaires
  • Création et utilisation d'index secondaires et d'index de jointure
  • Insertions, mises à jour et suppressions d'enregistrements
  • MERGE, UPSERT et contrôle des doublons
  • Transactions et gestion des verrous

Module 6 : Optimisation et réglage des performances

  • L'optimiseur de Teradata : comment il décide des plans d'exécution
  • Utilisation d'EXPLAIN et COLLECT STATISTICS
  • Skew (déséquilibre) et comment l'éviter
  • Bonnes pratiques de conception des requêtes
  • Identification des goulots d'étranglement (spool, verrous, redistribution)
  • Pratique : comparaison entre requêtes optimisées et non optimisées

Module 7 : Partitionnement et compression des données

  • Types de partitionnement : Range, Case, Multi-Level
  • Avantages et utilisation pratique dans les requêtes volumineuses
  • Block Level Compression (BLC) et Columnar Compression
  • Avantages et limites

Module 8 : Chargement et extraction de données

  • TPT (Teradata Parallel Transporter) vs FastLoad / MultiLoad
  • Chargement massif vs insertion par lots
  • Gestion des erreurs et tentatives répétées
  • Exportation des résultats vers des fichiers ou des systèmes externes
  • Automatisation de base avec des scripts et des utilitaires

Module 9 : Administration de base pour les utilisateurs techniques

  • Rôles et autorisations
  • Contrôle des ressources (Query Bands, Query Scheduler)
  • Surveillance avec DBQLOGTBL, DBC.Tables, ResUsage
  • Bonnes pratiques pour les environnements partagés

Module 10 : Laboratoire final d'intégration

  • Cas pratique de bout en bout :
    • Chargement des données
    • Transformation et agrégation
    • Création d'indicateurs avec des fonctions OLAP
    • Optimisation et explication
    • Exportation finale
  • Discussion sur les bonnes pratiques et les erreurs courantes

Pré requis

  • Compréhension des bases de données relationnelles et des concepts SQL
  • Expérience dans l'interrogation de grands ensembles de données ou travail dans des environnements de données
  • Familiarité avec les objectifs de l'intelligence économique ou de l'analytique

Audience

  • Analystes de données et professionnels de l'intelligence économique
  • Développeurs SQL et ingénieurs de données
  • Utilisateurs techniques qui gèrent ou optimisent les données dans les environnements Teradata
 35 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires