Plan du cours
Introduction à Teradata
Module 1: Fondamentaux de Teradata et son architecture
- Qu'est-ce que Teradata et à quoi sert-il ?
- Architecture parallèle : AMPs, PEs, BYNET
- Distribution des données et hashing
- Concepts clés : sessions, spool, locks
- Connexion au système : Teradata Studio / BTEQ / SQL Assistant
Module 2: Introduction à SQL dans Teradata
- SELECT de base, WHERE, ORDER BY
- Types de données et casting
- Fonctions mathématiques et de date
- Utilisation d'ALIAS, expressions CASE
- Opérateurs spéciaux de Teradata (TOP, QUALIFY, SAMPLE)
- Pratique guidée : requêtes sur des tables réelles
Module 3: Joins, sous-requêtes et opérateurs d'ensemble
- INNER, LEFT, RIGHT, FULL OUTER JOIN
- Joins sans clause ON (produit cartésien)
- Sous-requêtes scalaires et corrélatives
- UNION, INTERSECT, MINUS
- Exercices pratiques d'intégration de données
Module 4: Fonctions analytiques et OLAP
- RANK(), ROW_NUMBER(), DENSE_RANK()
- Partitionnement des données avec PARTITION BY
- Fenêtres avec OVER() et ORDER BY
- LAG(), LEAD(), FIRST_VALUE()
- Cas d'utilisation : KPIs, tendances, cumuls
Module 5: Gestion des données et tables
- Types de tables : permanentes, volatiles, temporaires globales
- Création et utilisation d'index secondaires et join indexes
- Insertions, mises à jour et suppression de enregistrements
- MERGE, UPSERT et contrôle des doublons
- Transactions et contrôle des locks
Module 6: Optimisation et tuning des performances
- L'Optimizeur de Teradata : comment il décide des plans
- Utilisation de EXPLAIN et COLLECT STATISTICS
- Skew et comment l'éviter
- Meilleures pratiques pour la conception des requêtes
- Identification des goulets d'étranglement (spool, locks, redistribution)
- Pratique : comparaison entre requêtes optimisées et non optimisées
Module 7: Partitionnement et compression des données
- Types de partitionnement : Range, Case, Multi-Level
- Avantages et utilisation pratique dans les requêtes à grande échelle
- Compression au niveau des blocs (BLC) et compression par colonnes
- Avantages et limitations
Module 8: Chargement et extraction de données
- TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
- Chargement massif vs. insertion par lot
- Gestion des erreurs et réessais
- Exportation de résultats vers des fichiers ou systèmes externes
- Automatisation basique avec scripts et utilitaires
Module 9: Administration de base pour les utilisateurs techniques
- Rôles et permissions
- Contrôle des ressources (Query Bands, Priority Scheduler)
- Surveillance avec DBQLOGTBL, DBC.Tables, ResUsage
- Bonnes pratiques pour les environnements partagés
Module 10: Laboratoire final d'intégration
-
Cas pratique de bout en bout :
- Chargement des données
- Transformation et agrégation
- Construction d'indicateurs avec les fonctions OLAP
- Optimisation et explication
- Exportation finale
- Discussion sur les bonnes pratiques et les erreurs courantes
Pré requis
- Compréhension des bases de données relationnelles et concepts de SQL
- Expérience dans la requête de grands ensembles de données ou le travail dans des environnements de données
- Familiarité avec les objectifs d'intelligence d'affaires ou l'analytique
Audience
- Analystes de données et professionnels de l'intelligence d'affaires
- Développeurs SQL et ingénieurs de données
- Utilisateurs techniques qui gèrent ou optimisent des données dans des environnements Teradata
Nos clients témoignent (1)
Formation intéressante, pleine de sujets captivants. Après chaque sujet, des exemples utiles étaient fournis.
Pawel Wojcikowski - MicroStrategy Poland Sp. z o.o.
Formation - Teradata Fundamentals
Traduction automatique