Plan du cours
Revues des bases d'Apache Airflow
- Concepts fondamentaux : DAG, tâches et opérateurs
- Architecture et composants d'Airflow
- Revue des cas d'utilisation et flux de travail courants
Optimisation des performances des flux de travail
- Identification des goulots d'étranglement dans les pipelines Airflow
- Techniques d'optimisation au niveau des tâches
- Exploitation des tentatives de reconnexion, de la parallélisation et de la concurrence des tâches
Gestion des dépendances complexes
- Définition de dépendances dynamiques dans les flux de travail
- Gestion des flux de travail conditionnels et ramifiés
- Utilisation efficace des groupes de tâches et des sous-DAG
Fonctionnalités avancées d'Apache Airflow
- Création d'opérateurs et de connecteurs personnalisés
- Mise en œuvre de capteurs pour les déclenchements externes
- Intégration de services tiers et de plugins
Mise à l'échelle des déploiements d'Apache Airflow
- Approches de mise à l'échelle horizontale et verticale
- Utilisation des exéculateurs Celery pour l'exécution distribuée
- Meilleures pratiques pour la mise à l'échelle dans les environnements cloud
Surveillance et débogage des flux de travail
- Configuration de la journalisation et des alertes pour la surveillance des flux de travail
- Utilisation de l'interface utilisateur et de l'interface de ligne de commande (CLI) d'Airflow pour le dépannage
- Identification et résolution des problèmes courants dans les déploiements d'Airflow
Sécurisation d'Apache Airflow
- Authentification et contrôle d'accès dans Airflow
- Protection des données sensibles et des configurations d'environnement
- Mise en œuvre de journaux d'audit pour les flux de travail
Cas d'utilisation en entreprise et meilleures pratiques
- Conception de flux de travail robustes pour les environnements de production
- Exploitation d'Airflow pour l'ingénierie des données et les pipelines ETL
- Exploration d'études de cas réelles de déploiements Airflow évolutifs
Résumé et prochaines étapes
Pré requis
- Connaissances de base d'Apache Airflow
- Maîtrise de la programmation Python et des concepts d'orchestration de flux de travail
- Expérience dans la gestion et le déploiement d'applications sur des environnements Linux
Public cible
- Ingénieurs de données
- Professionnels du DevOps
- Développeurs de logiciels
Nos clients témoignent (1)
L'instructeur a adapté la formation au niveau des participants et a répondu à toutes les questions. Il était très communicatif, et il était facile d'interagir avec lui. J'ai vraiment apprécié le format de la formation, qui comprenait de nombreux exercices pratiques. Dans l'ensemble, c'était une séance très engageante et bien organisée.
Jacek Chlopik - ZAKLAD UBEZPIECZEN SPOLECZNYCH
Formation - Apache Airflow: Building and Managing Data Pipelines
Traduction automatique