Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à AIOps avec des outils open source
- Vue d'ensemble des concepts et avantages d'AIOps
- Prometheus et Grafana dans la pile d'observabilité
- Où s'insère le ML dans AIOps : analyse prédictive vs analytique réactive
Configuration de Prometheus et Grafana
- Installation et configuration de Prometheus pour la collecte de données chronologiques
- Création de tableaux de bord dans Grafana à l'aide de métriques en temps réel
- Exploration des exporters, du reballage (relabeling) et de la découverte de services
Prétraitement des données pour le ML
- Extraction et transformation des métriques Prometheus
- Préparation des jeux de données pour la détection d'anomalies et la prévision
- Utilisation des transformations de Grafana ou des pipelines Python
Application du Machine Learning pour la détection d'anomalies
- Modèles ML de base pour la détection de valeurs aberrantes (par exemple, Isolation Forest, One-Class SVM)
- Entraînement et évaluation des modèles sur des données chronologiques
- Visualisation des anomalies dans les tableaux de bord Grafana
Prévision des métriques avec le ML
- Construction de modèles de prévision simples (ARIMA, Prophet, introduction à LSTM)
- Prédiction de la charge système ou de l'utilisation des ressources
- Utilisation des prévisions pour l'alerte précoce et les décisions d'échelle
Intégration du ML avec l'alerte et l'automatisation
- Définition des règles d'alerte basées sur la sortie du ML ou des seuils
- Utilisation d'Alertmanager et du routage des notifications
- Déclenchement de scripts ou de workflows d'automatisation lors de la détection d'anomalies
Mise à l'échelle et opérationnalisation d'AIOps
- Intégration d'outils d'observabilité externes (par exemple, pile ELK, Moogsoft, Dynatrace)
- Opérationnalisation des modèles ML dans les pipelines d'observabilité
- Meilleures pratiques pour AIOps à grande échelle
Résumé et prochaines étapes
Pré requis
- Une compréhension des concepts de surveillance et d'observabilité des systèmes
- De l'expérience avec Grafana ou Prometheus
- Familiarité avec Python et les principes de base de l'apprentissage automatique
Public cible
- Ingénieurs en observabilité
- Équipes infrastructure et DevOps
- Architectes de plateformes de surveillance et ingénieurs de fiabilité des sites (SRE)
14 Heures