Plan du cours
Introduction à Teradata
Module 1: Fondamentaux de Teradata et son architecture
- Qu'est-ce que Teradata et à quoi sert-il ?
- Architecture parallèle : AMPs, PEs, BYNET
- Distribution des données et hashing
- Concepts clés : sessions, spool, locks
- Connexion au système : Teradata Studio / BTEQ / SQL Assistant
Module 2: Introduction à SQL dans Teradata
- SELECT de base, WHERE, ORDER BY
- Types de données et casting
- Fonctions mathématiques et de date
- Utilisation d'ALIAS, expressions CASE
- Opérateurs spéciaux de Teradata (TOP, QUALIFY, SAMPLE)
- Pratique guidée : requêtes sur des tables réelles
Module 3: Joins, sous-requêtes et opérateurs d'ensemble
- INNER, LEFT, RIGHT, FULL OUTER JOIN
- Joins sans clause ON (produit cartésien)
- Sous-requêtes scalaires et corrélatives
- UNION, INTERSECT, MINUS
- Exercices pratiques d'intégration de données
Module 4: Fonctions analytiques et OLAP
- RANK(), ROW_NUMBER(), DENSE_RANK()
- Partitionnement des données avec PARTITION BY
- Fenêtres avec OVER() et ORDER BY
- LAG(), LEAD(), FIRST_VALUE()
- Cas d'utilisation : KPIs, tendances, cumuls
Module 5: Gestion des données et tables
- Types de tables : permanentes, volatiles, temporaires globales
- Création et utilisation d'index secondaires et join indexes
- Insertions, mises à jour et suppression de enregistrements
- MERGE, UPSERT et contrôle des doublons
- Transactions et contrôle des locks
Module 6: Optimisation et tuning des performances
- L'Optimizeur de Teradata : comment il décide des plans
- Utilisation de EXPLAIN et COLLECT STATISTICS
- Skew et comment l'éviter
- Meilleures pratiques pour la conception des requêtes
- Identification des goulets d'étranglement (spool, locks, redistribution)
- Pratique : comparaison entre requêtes optimisées et non optimisées
Module 7: Partitionnement et compression des données
- Types de partitionnement : Range, Case, Multi-Level
- Avantages et utilisation pratique dans les requêtes à grande échelle
- Compression au niveau des blocs (BLC) et compression par colonnes
- Avantages et limitations
Module 8: Chargement et extraction de données
- TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
- Chargement massif vs. insertion par lot
- Gestion des erreurs et réessais
- Exportation de résultats vers des fichiers ou systèmes externes
- Automatisation basique avec scripts et utilitaires
Module 9: Administration de base pour les utilisateurs techniques
- Rôles et permissions
- Contrôle des ressources (Query Bands, Priority Scheduler)
- Surveillance avec DBQLOGTBL, DBC.Tables, ResUsage
- Bonnes pratiques pour les environnements partagés
Module 10: Laboratoire final d'intégration
-
Cas pratique de bout en bout :
- Chargement des données
- Transformation et agrégation
- Construction d'indicateurs avec les fonctions OLAP
- Optimisation et explication
- Exportation finale
- Discussion sur les bonnes pratiques et les erreurs courantes
Pré requis
- Compréhension des bases de données relationnelles et concepts de SQL
- Expérience dans la requête de grands ensembles de données ou le travail dans des environnements de données
- Familiarité avec les objectifs d'intelligence d'affaires ou l'analytique
Audience
- Analystes de données et professionnels de l'intelligence d'affaires
- Développeurs SQL et ingénieurs de données
- Utilisateurs techniques qui gèrent ou optimisent des données dans des environnements Teradata
Nos clients témoignent (1)
Nice training, full of interesting topics. After each topic helpful examples were provided.