Résumé du cours
Le cours SRE (Site Reliability Engineering) Foundation℠ est une introduction aux principes et pratiques de l’ingénierie de fiabilité des sites permettant à une organisation de mettre à l'échelle de manière fiable et économique des services critiques. L'introduction d'une dimension de fiabilité des sites nécessite un réalignement organisationnel, un nouvel accent sur l'ingénierie et l'automatisation, et l'adoption d'une série de nouveaux paradigmes de travail. Ce cours met en évidence l'évolution du SRE et son orientation future afin de fournir aux participants des pratiques, méthodes et outils nécessaires pour engager les personnes de toute l’organisation impliquées dans la fiabilité et la stabilité, à travers des mises en situation afin de comprendre, définir et suivre les objectifs de niveau de service (SLO). Cette formation prépare également au passage de la certification « Site Reliability Engineer Foundation (SREF)℠ » du DevOps Institute.
A qui s'adresse cette formation
Tout professionnel impliqué dans l’ingénierie de la fiabilité des sites. Dans l’approche moderne de leadership et de changement organisationnel dans le domaine de l’IT. (Directeur, Chef de projet et Responsable IT, Product Owner et Scrum Master, Ingénieur logiciel, etc.).
Pré-requis
Posséder des connaissances générales en matière de systèmes logiciels.
Objectifs
A l'issue de cette formation, vous serez en mesure de :
- Les rapports entre le SRE, DevOps et les frameworks ;
- Les objectifs de niveau de service (SLO) et leur orientation vers l'utilisateur ;
- Les indicateurs de niveau de service (SLI) et le paysage moderne de la surveillance ;
- Les outils SRE, les techniques d'automatisation et l'importance de la sécurité ;
- Se préparer à la certification « Site Reliability Engineer Foundation (SRE)℠ ».
Contenu
Introduction
Principes et pratiques du SRE :
- Qu'est-ce que l'ingénierie de la fiabilité des sites ?
- SRE & DevOps : Quelle est la différence ?
- Principes et pratiques du SRE.
Objectifs de niveau de service et budgets d'erreur :
- Objectifs de niveau de service (SLO) ;
- Budgets erronés ;
- Erreur de politique budgétaire.
Réduire le Toil :
- Qu'est-ce que Toil ?
- Pourquoi le Toil est-il mauvais ?
- Faire quelque chose face au Toil.
Suivi et indicateurs de niveau de service :
- Indicateurs de niveau de service (SLI) ;
- Suivi ;
- Observabilité.
Outils et automatisation du SRE :
- Définition de l'automatisation ;
- Focus sur l'automatisation ;
- Hiérarchie des types d'automatisation ;
- Automatisation sécurisée ;
- Outils d'automatisation.
Anti-fragilité et apprentissage de l'échec :
- Pourquoi tirer les leçons des échecs ?
- Avantages de l'anti-fragilité ;
- Changer l'équilibre organisationnel ;
Impact organisationnel du SRE :
- Pourquoi les organisations adoptent le SRE ;
- Modèles pour l'adoption du SRE ;
- Responsabilités ;
- Traitement des incidents ;
- Des autopsies irréprochables ;
- SRE et échelle.
SRE, autres cadres, tendance :
- SRE et autres cadres ;
- Tendance.