Prenez contact avec nous

Plan du cours

Fondements des exploitations cloud sur AWS

  • Rôles et responsabilités opérationnels dans le cloud
  • Structure des comptes AWS, organisations et stratégie multi-comptes
  • Services opérationnels principaux : CloudWatch, CloudTrail, AWS Config

Infrastructure en tant que code et provisionnement

  • Principes de l'IaC et de l'infrastructure immuable
  • Provisionnement avec Terraform et AWS CloudFormation
  • Gestion de l'état, des modules et de la promotion des environnements

CI/CD et stratégies de déploiement

  • Conception de pipelines CI/CD pour les applications natives du cloud
  • Déploiements bleu/vert, en canaris et en roulement
  • Automatisation du retour arrière, des contrôles de santé et de la validation des versions

Surveillance, observabilité et alertes

  • Métriques, journaux et traces : collecter, stocker et analyser
  • Utilisation de CloudWatch, X-Ray et d'outils d'observabilité tiers
  • Définition des SLO/SLI, des politiques d'alerte et des pratiques de service de permanence

Opérations de sécurité et gestion des identités

  • Meilleures pratiques IAM, privilège minimal et accès inter-comptes
  • Gestion des secrets, KMS et entrepôts de paramètres sécurisés
  • Sécurité opérationnelle : stratégies de correction, analyse des vulnérabilités et traces d'audit

Résilience, sauvegarde et reprise après sinistre

  • Conception pour la tolérance aux pannes et la haute disponibilité
  • Stratégies de sauvegarde, automatisation des instantanés et procédures de restauration
  • Planification de la reprise après sinistre et création de manuels de procédure

Optimisation des coûts et gouvernance

  • Visibilité des coûts : facturation, étiquetage et stratégies d'allocation des coûts
  • Ajustement des instances, instances réservées/plans d'économies et contrôles budgétaires
  • Gouvernance : politiques, garde-fous et automatisation pour la conformité

Conteneurs, serverless et opérations d'exécution

  • Considérations opérationnelles pour ECS, EKS et Lambda
  • Découverte de services, mise à l'échelle automatique et limites de ressources
  • Journalisation, traçage et débogage des charges de travail conteneurisées

Réponse aux incidents, manuels de procédure et ingénierie du chaos

  • Réponse aux incidents basée sur les manuels de procédure et pratiques post-incident
  • Automatisation de la remédiation et motifs d'auto-guérison
  • Introduction aux expériences de chaos pour valider la résilience

Atelier pratique : exploitation d'une charge de travail exemple

  • Déploiement d'une application exemple à l'aide de l'IaC et d'un pipeline CI/CD
  • Mise en œuvre de la surveillance, des alertes et d'un script de remédiation automatisé
  • Simulation d'incidents et pratique de la réponse basée sur les manuels de procédure

Résumé et prochaines étapes

Pré requis

  • Une compréhension de base des concepts du cloud et des réseaux
  • Familiarité avec la ligne de commande Linux et la programmation de scripts
  • Expérience avec le contrôle de sources (Git) et les concepts de base de la CI/CD

Public cible

  • Ingénieurs des opérations cloud
  • ingénieurs SRE et de la plateforme
  • Ingénieurs DevOps et chefs d'équipe techniques
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires