Plan du cours
Rappel des fondamentaux d'Apache Airflow
- Concepts clés : DAGs, opérateurs et flux d'exécution
- Architecture et composants d'Airflow
- Compréhension des cas d'utilisation et workflows avancés
Création d'opérateurs personnalisés
- Compréhension de la structure d'un opérateur Airflow
- Développement d'opérateurs personnalisés pour des tâches spécifiques
- Tests et débogage des opérateurs personnalisés
Hook et capteurs personnalisés
- Mise en œuvre de hooks pour l'intégration avec des systèmes externes
- Création de capteurs pour la surveillance des déclencheurs externes
- Amélioration de l'interactivité des workflows avec des capteurs personnalisés
Développement de plugins Airflow
- Compréhension de l'architecture des plugins
- Conception de plugins pour étendre les fonctionnalités d'Airflow
- Meilleures pratiques pour la gestion et le déploiement des plugins
Intégration d'Airflow avec des systèmes externes
- Connexion d'Airflow aux bases de données, API et services cloud
- Utilisation d'Airflow pour les workflows ETL et le traitement de données en temps réel
- Gestion des dépendances entre Airflow et les systèmes externes
Débogage et surveillance avancés
- Utilisation des journaux et métriques d'Airflow pour le dépannage
- Configuration des alertes et notifications pour les problèmes de workflow
- Exploitation d'outils de surveillance externes avec Airflow
Optimisation des performances et de la évolutivité
- Extension d'Airflow avec les exécuteurs Celery et Kubernetes
- Optimisation de l'utilisation des ressources dans les workflows complexes
- Stratégies pour la haute disponibilité et la tolérance aux pannes
Études de cas et applications pratiques
- Exploration de cas d'utilisation avancés en ingénierie des données et DevOps
- Étude de cas : Mise en œuvre d'un opérateur personnalisé pour un ETL à grande échelle
- Meilleures pratiques pour la gestion des workflows au niveau entreprise
Résumé et prochaines étapes
Pré requis
- Bonne compréhension des bases d'Apache Airflow, y compris les DAGs, les opérateurs et l'architecture d'exécution
- Maîtrise de la programmation en Python
- Expérience dans l'intégration de systèmes de données et l'orchestration de workflows
Public cible
- Ingénieurs des données
- Ingénieurs DevOps
- Architectes logiciels
Nos clients témoignent (1)
L'instructeur a adapté la formation au niveau des participants et a répondu à toutes les questions. Il était très communicatif, et il était facile d'interagir avec lui. J'ai vraiment apprécié le format de la formation, qui comprenait de nombreux exercices pratiques. Dans l'ensemble, c'était une séance très engageante et bien organisée.
Jacek Chlopik - ZAKLAD UBEZPIECZEN SPOLECZNYCH
Formation - Apache Airflow: Building and Managing Data Pipelines
Traduction automatique