Prenez contact avec nous

Plan du cours

Introduction à AIOps avec des outils open source

  • Vue d'ensemble des concepts et avantages d'AIOps
  • Prometheus et Grafana dans la pile d'observabilité
  • Où s'insère le ML dans AIOps : analyse prédictive vs analytique réactive

Configuration de Prometheus et Grafana

  • Installation et configuration de Prometheus pour la collecte de données chronologiques
  • Création de tableaux de bord dans Grafana à l'aide de métriques en temps réel
  • Exploration des exporters, du reballage (relabeling) et de la découverte de services

Prétraitement des données pour le ML

  • Extraction et transformation des métriques Prometheus
  • Préparation des jeux de données pour la détection d'anomalies et la prévision
  • Utilisation des transformations de Grafana ou des pipelines Python

Application du Machine Learning pour la détection d'anomalies

  • Modèles ML de base pour la détection de valeurs aberrantes (par exemple, Isolation Forest, One-Class SVM)
  • Entraînement et évaluation des modèles sur des données chronologiques
  • Visualisation des anomalies dans les tableaux de bord Grafana

Prévision des métriques avec le ML

  • Construction de modèles de prévision simples (ARIMA, Prophet, introduction à LSTM)
  • Prédiction de la charge système ou de l'utilisation des ressources
  • Utilisation des prévisions pour l'alerte précoce et les décisions d'échelle

Intégration du ML avec l'alerte et l'automatisation

  • Définition des règles d'alerte basées sur la sortie du ML ou des seuils
  • Utilisation d'Alertmanager et du routage des notifications
  • Déclenchement de scripts ou de workflows d'automatisation lors de la détection d'anomalies

Mise à l'échelle et opérationnalisation d'AIOps

  • Intégration d'outils d'observabilité externes (par exemple, pile ELK, Moogsoft, Dynatrace)
  • Opérationnalisation des modèles ML dans les pipelines d'observabilité
  • Meilleures pratiques pour AIOps à grande échelle

Résumé et prochaines étapes

Pré requis

  • Une compréhension des concepts de surveillance et d'observabilité des systèmes
  • De l'expérience avec Grafana ou Prometheus
  • Familiarité avec Python et les principes de base de l'apprentissage automatique

Public cible

  • Ingénieurs en observabilité
  • Équipes infrastructure et DevOps
  • Architectes de plateformes de surveillance et ingénieurs de fiabilité des sites (SRE)
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires