Plan du cours
Introduction à Teradata
Module 1 : Fondements et architecture de Teradata
- Qu'est-ce que Teradata et à quoi sert-il ?
- Architecture parallèle : AMPs, PEs, BYNET
- Distribution des données et hachage
- Concepts clés : sessions, spool, verrous
- Connexion au système : Teradata Studio / BTEQ / SQL Assistant
Module 2 : Introduction à SQL dans Teradata
- SELECT de base, WHERE, ORDER BY
- Types de données et conversion
- Fonctions mathématiques et date
- Utilisation d'ALIAS, des expressions CASE
- Opérateurs spécifiques à Teradata (TOP, QUALIFY, SAMPLE)
- Pratique guidée : requêtes sur des tables réelles
Module 3 : Joins, sous-requêtes et opérateurs de jeu
- INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN
- Joins sans clause ON (produit cartésien)
- Sous-requêtes scalaires et corrélées
- UNION, INTERSECT, MINUS
- Exercices pratiques sur l'intégration de données
Module 4 : Fonctions analytiques et OLAP
- RANK(), ROW_NUMBER(), DENSE_RANK()
- Partitionnement des données avec PARTITION BY
- Fenêtrage avec OVER() et ORDER BY
- LAG(), LEAD(), FIRST_VALUE()
- Cas d'utilisation : KPIs, tendances, valeurs cumulées
Module 5 : Données et tables Management
- Types de table : permanentes, volatiles, temporaires globales
- Création et utilisation d'index secondaires et de jointure
- Opérations d’insertion, mise à jour et suppression
- MERGE, UPSERT et contrôle des doublons
- Transactions et contrôle des verrous
Module 6 : Optimisation et ajustement de performance
- Optimiseur Teradata : comment il choisit les plans d'exécution
- Utilisation de EXPLAIN et COLLECT STATISTICS
- Torsion et comment l'éviter
- Meilleures pratiques en matière de conception des requêtes
- Identification des goulets d’étranglement (spool, verrous, redistribution)
- Pratique : comparaison des requêtes optimisées et non optimisées
Module 7 : Partitionnement et compression des données
- Types de partitionnement : Range, Case, Multi-Level
- Avantages et usages pratiques dans les grandes requêtes
- Compression au niveau du bloc (BLC) et compression par colonnes
- Avantages et limites
Module 8 : Chargement et extraction de données
- TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
- Chargement en masse vs. insertions par lots
- Gestion des erreurs et des redémarrages
- Exportation des résultats vers des fichiers ou des systèmes externes
- Automatisation de base avec des scripts et utilitaires
Module 9 : Administration de base pour les utilisateurs techniques
- Rôles et permissions
- Contrôle des ressources (Query Bands, Priority Scheduler)
- Suivi avec DBQLOGTBL, DBC.Tables, ResUsage
- Meilleures pratiques pour les environnements partagés
Module 10 : Laboratoire d'intégration finale
- Cas pratique de bout en bout :
- Chargement des données
- Transformation et agrégation
- Création de KPIs avec les fonctions OLAP
- Optimisation et EXPLAIN
- Export final
- Discussion sur les meilleures pratiques et erreurs courantes
Résumé et prochains pas
Pré requis
- Compréhension des bases de données relationnelles et des concepts SQL
- Expérience dans l'interrogation de grands ensembles de données ou dans la gestion d'environnements de données
- Familiarité avec les objectifs de l'intelligence d'affaires ou des analyses
Public cible
- Analystes de données et professionnels de l'intelligence d'affaires
- Développeurs SQL et ingénieurs des données
- Utilisateurs techniques gérant ou optimisant les données dans des environnements Teradata
Nos clients témoignent (1)
Formation intéressante, remplie de sujets captivants. Des exemples utiles ont été fournis après chaque sujet.
Pawel Wojcikowski - MicroStrategy Poland Sp. z o.o.
Formation - Teradata Fundamentals
Traduction automatique