Course Overview
In diesem offiziellen 3 tägigen Site Reliability Engineering (SRE) Foundation℠ Training erlernen Sie die Inhalte des Google Operation Modell für Service Management und klären die zentrale Frage, was passiert, wenn sie einen Software-Ingenieur bitten, ein Service Management zu entwerfen.
In dem SRE (Site Reliability Engineering) Foundation℠ Training lernen Sie innovative und moderne Verfahren und Methoden zur Verbesserung der Verlässlichkeit (Reliability) von IT Services. Hierbei bekommen sie einen Einblick in die Prinzipien und Praktiken, die eine Organisation in die Lage versetzen, kritische IT Services zuverlässig und wirtschaftlich zu erbringen. Dies wird durch ein Zusammenspiel aus Automatisierung, Arbeitsmethoden und einer organisatorischer Neuausrichtung erreicht. Sie lernen wie der Weltkonzern Google die Reliability seiner IT Services in einer hoch dynamischen und komplexen Umgebung verbessert hat, ohne klassische Trennung von Entwicklung und Service-Management (Betrieb) aufheben zu müssen.
Who should attend
Jeder, der eine Initiative zur Erhöhung der Verlässlichkeit (reliability) von IT Services startet oder leitet.
Prerequisites
Sie benötigen keine Vorkenntnisse, um an der SRE Foundation teilnehmen zu können. Alle notwendigen Inhalte werden Ihnen im Training vermittelt. Vorkenntnisse in Service Management oder DevOps sind von Vorteil.
Course Objectives
In diesem 3-tägigen Site Reliability Engineering Foundation Training lernen Sie eine Reihe von Verfahren und Methoden zur Verbesserung der Verlässlichkeit (Reliability) von IT Services. Hierbei bekommen sie einen Einblick in die Prinzipien und Praktiken, die eine Organisation in die Lage versetzen, kritische IT Services zuverlässig und wirtschaftlich zu erbringen. Dies wird durch ein Zusammenspiel aus Automatisierung, Arbeitsmethoden und einer organisatorischer Neuausrichtung erreicht.
Der Ursprung des Site Reliability Engineering liegt bei dem Unternehmen Google. Einem der grossen US-amerikanischen IT-Technologie-Konzerne. Der Unternehmenserfolg ist bei Google eng mit der IT verknüpft und man suchte damals nach Mitteln, Wegen und Organisationsmodellen, um dem Wachstum gerecht zu werden. Zwar wurde und wird die klassische Trennung von Entwicklung und Service-Management (Betrieb) auch bei Google aufrechterhalten, aber man stellte sich zum Thema Service-Management folgende Fragen:
- Wie eng sollten Softwareentwicklung und Betrieb verzahnt werden und welche Regelungsprozesse werden benötigt?
Aus dieser Fragestellung und der Umsetzung der Antworten entstand das Site-Reliability-Engineering als ein neues Service Management Modell. SRE (Site Reliability Engineering) ist komplementär zu den Prinzipien von ITIL 4 und DevOps und ergänzt diese um ein konkretes Betriebskonzept (Operation Model).
Der Kurs vermittelt den Teilnehmern die Praktiken, Methoden und Werkzeuge mit Hilfe von reellen Szenarien und Fallbeispielen. Nach Abschluss des Kurses haben die Teilnehmer greifbare Anhaltspunkte, die sie nach ihrer Rückkehr in Ihre Umgebungen nutzen können, wie z.B. das Verstehen, Setzen und Verfolgen von Service Level Objectives (SLO's).
Dieser Kurs versetzt die Lernenden in die Lage, die Zertifizierungsprüfung der SRE Foundation (DOI, DevOps Institute) erfolgreich abzuschliessen. Die Zertifizierungsprüfung legen die Teilnehmer im Anschluss an den Kurs eigenständig ab.
Course Content
Das Training ist offiziell akkreditiert und vermittelt die Inhalte aus dem Lehrplan des DOI (DevOps Institute). Die wesentlichen Inhalte des Trainings sind:
- Die Geschichte von SRE und seine Entstehung bei Google
- Die Wechselbeziehung von SRE mit DevOps, ITIL und anderen populären Rahmenwerken
- Die Grundprinzipien von SRE
- Service-Level-Ziele (SLO's)
- Service Level Indicators (SLI's) und die moderne Überwachungslandschaft
- Fehlerbudgets (error budgets) und die damit verbundenen Fehlerbudget-Policies
- „Toil“ und ihre Auswirkung auf die Produktivität einer Organisation
- Praktische Schritte, die zur Beseitigung von „Toil“ beitragen können
- Beobachtungsfähigkeit als Indikator für die Gesundheit eines Service
- SRE-Werkzeuge, Automatisierungstechniken und die Bedeutung der Sicherheit
- Anti-Fragility, die Herangehensweise an Versagen und Failure Testing
- Die organisatorischen Auswirkungen, die die Einführung von SRE mit sich bringt