Plan du cours
Fondements des opérations cloud sur AWS
- Rôles et responsabilités opérationnels dans le cloud
- Structure de compte AWS, organisations et stratégie multi-comptes
- Services opérationnels clés : CloudWatch, CloudTrail, AWS Config
Infrastructure as Code et provisionnement
- Principes de l'IaC et de l'infrastructure immuable
- Provisionnement avec Terraform et AWS CloudFormation
- Gestion de l'état, des modules et de la promotion d'environnement
CI/CD et stratégies de déploiement
- Conception de pipelines CI/CD pour des applications cloud natives
- Déploiements bleu/vert, canaris et progressifs
- Automatisation du rollback, des checks d'intégrité et de la validation de release
Surveillance, observabilité et alerting
- Métriques, logs et traces : expédition, stockage et analyse
- Utilisation de CloudWatch, X-Ray et d'outils d'observabilité tiers
- Définition des SLOs/SLIs, des politiques d'alerting et des pratiques on-call
Opérations de sécurité et gestion d'identité
- Meilleures pratiques IAM, privilège minimal et accès inter-comptes
- Gestion des secrets, KMS et magasins de paramètres sécurisés
- Sécurité opérationnelle : stratégies de mise à jour, scan de vulnérabilités et traces d'audit
Résilience, sauvegarde et récupération d'urgence
- Conception pour une tolérance aux pannes et une haute disponibilité
- Stratégies de sauvegarde, automatisation des snapshots et procédures de restauration
- Planification de la récupération d'urgence et création de runbooks
Optimisation des coûts et gouvernance
- Visibilité sur les coûts : facturation, tagging et stratégies d'allocation de coûts
- Redimensionnement, instances réservées/plans d'économie et contrôles budgétaires
- Gouvernance : politiques, garde-fous et automatisation pour la conformité
Conteneurs, serverless et opérations d'exécution
- Considérations opérationnelles pour ECS, EKS et Lambda
- Découverte de services, autoscaling et limites de ressources
- Journalisation, traçage et débogage des charges de travail conteneurisées
Réponse aux incidents, runbooks et ingénierie du chaos
- Réponse aux incidents basée sur les runbooks et pratiques de postmortem
- Automatisation des remèdes et motifs d'autoguérison
- Introduction aux expériences de chaos pour valider la résilience
Atelier pratique : Exploiter une charge de travail d'exemple
- Déployer une application d'exemple à l'aide de IaC et un pipeline CI/CD
- Mettre en place la surveillance, les alertes et un script d'automatisation de remède
- Simuler des incidents et pratiquer une réponse basée sur les runbooks
Résumé et étapes suivantes
Pré requis
- Une compréhension de base des concepts cloud et du réseau
- Familiarité avec la ligne de commande Linux et le scripting
- Expérience avec le contrôle de version (Git) et les concepts de base CI/CD
Public cible
- Ingénieurs opérationnels cloud
- SREs et ingénieurs plateforme
- Ingénieurs DevOps et responsables d'équipe technique
Nos clients témoignent (5)
Le formateur maîtrisait bien les concepts
Josheel - Verizon Connect
Formation - Amazon Redshift
Traduction automatique
La partie pratique.
Radu - Ness Digital Engineering
Formation - AWS: A Hands-on Introduction to Cloud Computing
Traduction automatique
Le formateur connaissait exactement de quoi ils parlaient.
Madumetsa Msomi - BMW
Formation - AWS DevOps Engineers
Traduction automatique
Tout est bon, rien à améliorer
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Formation - AWS Lambda for Developers
Traduction automatique
Applications IoT
Palaniswamy Suresh Kumar - Makers' Academy
Formation - Industrial Training IoT (Internet of Things) with Raspberry PI and AWS IoT Core 「4 Hours Remote」
Traduction automatique