DevOps-Reifegrad messen: So bewerten und benchmarken Sie Ihren Stand
DORA-Metriken, Reifegradmodelle und Value-Stream-Mapping — die wichtigsten Methoden, um den DevOps-Reifegrad Ihres Unternehmens objektiv zu bewerten und Verbesserungspotenziale zu identifizieren.

Andreas Schönfeld
Geschäftsführer & DevOps-Berater, Comquent GmbH
18+ Jahre Erfahrung in DevOps, CI/CD und Industrial Automation
Auf einen Blick
Eine DevOps-Reifegradanalyse (englisch: DevOps Maturity Assessment) ist eine systematische Bewertung des aktuellen Stands eines Unternehmens in den Dimensionen Kultur, Automatisierung, Prozesse und Metriken. Das Ziel: objektiv messen, wo Sie stehen, und datenbasiert entscheiden, wo Sie investieren.
Die drei wichtigsten Methoden sind: DORA-Metriken (quantitative Performance-Messung anhand von 4 Schlüsselkennzahlen, entwickelt vom DORA-Team — DevOps Research and Assessment, gegründet von Dr. Nicole Forsgren, Jez Humble und Gene Kim, heute Teil von Google Cloud), Reifegradmodelle (qualitative Einordnung in 5 Stufen, auch bekannt als DevOps Maturity Model) und Value-Stream-Mapping (Prozessanalyse zur Engpass-Identifikation).
Warum den Reifegrad messen?
„Wir machen DevOps" hören wir oft. Aber was genau bedeutet das? Haben Sie eine CI/CD-Pipeline? Automatisierte Tests? Infrastructure as Code? Oder bedeutet es, dass Entwickler und Operations im selben Slack-Kanal sind?
Ohne eine objektive Messung bleibt DevOps ein Bauchgefühl. Sie wissen nicht, wo Sie stehen, können Fortschritte nicht nachweisen und haben keine Grundlage für Investitionsentscheidungen. Führungskräfte fragen: „Was bringt uns DevOps konkret?" — und ohne Metriken haben Sie keine Antwort. Genau hier setzt ein systematisches DevOps-Coaching an.
Die gute Nachricht: Es gibt bewährte Frameworks für DevOps-Benchmarking, die den DevOps-Reifegrad messbar machen. In diesem Artikel stellen wir die drei wichtigsten vor: DORA-Metriken (die wichtigsten DevOps-KPIs), das DevOps-Reifegradmodell und Value-Stream-Mapping.
Die drei Säulen der DevOps-Messung
DORA-Metriken
Quantitative Performance-Messung mit 4 Schlüsselmetriken
Reifegradmodell
Qualitative Einordnung in 5 Stufen über alle Dimensionen
Value-Stream-Mapping
Prozessanalyse zur Identifikation von Engpässen und Wartezeiten
1. DORA-Metriken — die wichtigsten DevOps-KPIs
Das DORA-Team (DevOps Research and Assessment, gegründet von Dr. Nicole Forsgren, Jez Humble und Gene Kim, heute Teil von Google Cloud) hat in jahrelanger Forschung vier Metriken identifiziert, die die Software-Delivery-Performance zuverlässig messen — wie im Buch „Accelerate" (2018) wissenschaftlich belegt. Diese DevOps-KPIs sind branchenübergreifend anerkannt und bilden die Grundlage des jährlichen State of DevOps Report.
Für eine detaillierte Anleitung zur Messung und Verbesserung aller vier Metriken lesen Sie unseren Artikel DORA Metrics: DevOps-Performance messen.
| Metrik | Elite | High | Medium | Low |
|---|---|---|---|---|
| Deployment Frequency Deployment-Häufigkeit | Mehrmals pro Tag | Einmal pro Woche bis einmal pro Monat | Einmal pro Monat bis alle 6 Monate | Seltener als alle 6 Monate |
| Lead Time for Changes Vorlaufzeit für Änderungen | Weniger als 1 Stunde | 1 Tag bis 1 Woche | 1 Woche bis 1 Monat | Mehr als 1 Monat |
| Change Failure Rate Änderungs-Fehlerquote | 0–5 % | 6–15 % | 16–30 % | Mehr als 30 % |
| Mean Time to Recovery Mittlere Wiederherstellungszeit | Weniger als 1 Stunde | Weniger als 1 Tag | 1 Tag bis 1 Woche | Mehr als 1 Woche |
Quelle: State of DevOps Report 2024 (dora.dev). Der DORA 2025 Report führt 7 Team-Archetypes als differenziertere Kategorisierung ein.
Update 2025: 7 Team-Archetypes statt 4 Performance-Level
Der DORA 2025 Report ersetzt das bisherige 4-Stufen-Modell (Elite/High/Medium/Low) durch sieben differenzierte Team-Archetypes. Diese berücksichtigen, dass Teams nicht linear auf einer Skala einzuordnen sind, sondern unterschiedliche Stärkeprofile haben können. Für das DevOps-Benchmarking bedeutet das: Vergleichen Sie sich nicht mehr pauschal mit „Elite", sondern identifizieren Sie Ihren Archetyp und die spezifischen Verbesserungshebel.
Wichtig für industrielle Umgebungen
In der OT-Welt gelten andere Maßstäbe. „Elite"-Performance bei Deployment Frequency bedeutet für eine SPS-Anlage nicht 50 Deployments pro Tag, sondern kontrollierte, automatisierte Releases im geplanten Wartungsfenster. Passen Sie die Benchmarks an Ihre Branche an — mehr dazu im Abschnitt DevOps-Reifegrad in industriellen Umgebungen.
Tools für die automatische DORA-Metrik-Erfassung
DORA-Dashboards, Change-Tracking
Dev-Workflow-Analytics, Benchmarks
Open-Source, Multi-Tool-Integration
Nativ in GitLab integriert
GitHub-fokussiert, Team-Insights
Engineering-Management-Plattform
2. Das DevOps-Reifegradmodell: 5 Stufen der Reife
Während DORA-Metriken die Performance quantitativ messen, bietet ein Reifegradmodell eine qualitative Einordnung über alle Dimensionen: Technologie, Prozesse, Kultur und Organisation.
Level 1: Initial
- Manuelle Builds und Deployments
- Keine oder minimale Testautomatisierung
- Versionskontrolle nur sporadisch genutzt
- Kein definierter Release-Prozess
- Wissen in einzelnen Köpfen, nicht dokumentiert
Viele OT-Teams starten hier — das ist keine Schande, sondern der Ausgangspunkt.
Level 2: Managed
- Versionskontrolle ist Standard (Git)
- Grundlegende CI: automatisierte Builds
- Einige manuelle Tests vor dem Release
- Dokumentierte Release-Prozesse
- Erste Metriken werden erhoben
Der erste große Schritt — Git und automatisierte Builds sind die Basis für alles Weitere.
Level 3: Defined
- Vollständige CI/CD-Pipeline implementiert
- Automatisierte Tests (Unit, Integration)
- Infrastructure as Code für Umgebungen
- Quality Gates definiert und durchgesetzt
- Deployment-Prozess weitgehend automatisiert
Hier beginnt der echte Produktivitätssprung — manuelle Fehlerquellen verschwinden.
Level 4: Measured
- DORA-Metriken werden aktiv gemessen
- Feedback-Schleifen in die Pipeline integriert
- Security in die Pipeline integriert (DevSecOps)
- Datengetriebene Entscheidungen über Verbesserungen
- Automatisierte Compliance-Checks
Die Basis für kontinuierliche Verbesserung — Sie wissen, wo Sie stehen und wohin Sie wollen.
Level 5: Optimizing
- Kontinuierliche Optimierung basierend auf Metriken
- Self-Service-Plattform für Entwicklerteams
- KI-gestützte Anomalie-Erkennung in Pipelines
- Chaos Engineering und Resilience Testing
- Kulturell: Blameless Postmortems, Lernorganisation
Das Ziel — aber kein Endzustand. Auch Level 5 bedeutet: weiter lernen, weiter verbessern.
3. Value-Stream-Mapping: Engpässe finden
DORA-Metriken und Reifegradmodelle zeigen wo Sie stehen. Value-Stream-Mapping zeigt warum — und liefert konkrete Ansatzpunkte für Verbesserungen. Die Methode kommt aus dem Lean Manufacturing und passt perfekt zur Industrial-DevOps-Welt.
Typisches Ergebnis eines Value-Stream-Mappings
Value-Stream-Mapping in 6 Schritten
Prozess abgrenzen
Definieren Sie Start- und Endpunkt: vom Feature-Request oder Bug-Report bis zum produktiven Deployment. Welche Teams und Systeme sind beteiligt?
Ist-Zustand aufnehmen
Dokumentieren Sie jeden Schritt im aktuellen Prozess: Wer macht was, wie lange dauert es, welche Übergaben gibt es? Post-its an einer großen Wand sind ideal.
Wartezeiten identifizieren
Messen Sie die aktive Arbeitszeit vs. Wartezeit pro Schritt. Häufig sind 80 % der Lead Time reine Wartezeit — z.B. auf Freigaben, Umgebungen oder Feedback.
Engpässe markieren
Wo staut sich die Arbeit? Welcher Schritt hat die längste Wartezeit? Wo entstehen die meisten Fehler? Diese Engpässe sind Ihre größten Hebel.
Soll-Zustand entwerfen
Wie sähe der ideale Prozess aus? Welche manuellen Schritte können automatisiert werden? Welche Übergaben können eliminiert werden?
Maßnahmen priorisieren
Nicht alles auf einmal. Priorisieren Sie nach Impact und Aufwand. Starten Sie mit dem Engpass, der den größten Hebel hat — oft ist es die Test-Automatisierung.
DevOps Assessment-Fragebogen: 10 Fragen für Ihren Schnellcheck
Beantworten Sie diese 10 Fragen mit Ja oder Nein. Jedes Ja ist ein Punkt. Ihre Punktzahl gibt eine erste Orientierung.
Anfangsphase — großes Potenzial
Gute Basis — gezielte Verbesserungen möglich
Fortgeschritten — Optimierung und Skalierung
5 häufige Fehler bei der Reifegradmessung
Die Messung selbst kann schiefgehen. Diese Fehler sehen wir regelmäßig.
Nur Tooling messen
Ein Reifegradmodell, das nur Tools und Technologien bewertet, übersieht die kulturellen und prozessualen Aspekte — die oft die größten Hebel sind.
Reifegrad als Ziel
Level 5 ist kein Selbstzweck. Ein Unternehmen mit 2 Releases pro Jahr braucht keine Pipeline für 50 Deployments pro Tag.
Einmalige Messung
Der Reifegrad wird einmal erhoben und dann vergessen. Ohne regelmäßige Messung gibt es kein Feedback über Fortschritt oder Rückschritt.
Vergleich mit anderen Unternehmen
Jedes Unternehmen hat andere Voraussetzungen. Ein Vergleich mit Google oder Netflix ist irreführend und demotivierend.
Metriken ohne Kontext
Deployment Frequency allein sagt nichts aus. 50 Deployments pro Tag bei 30 % Fehlerquote sind schlimmer als 2 pro Woche bei 1 % Fehlerquote.
DevOps-Reifegrad in industriellen Umgebungen (OT)
Kein Wettbewerber behandelt den DevOps-Reifegrad spezifisch für industrielle Umgebungen — dabei unterscheiden sich die Anforderungen grundlegend. In der OT-Welt (Operational Technology) gelten andere Rahmenbedingungen als in der klassischen IT-Softwareentwicklung.
Safety vor Speed
In Produktionsanlagen hat funktionale Sicherheit (Safety) oberste Priorität. Ein fehlerhaftes Deployment kann physischen Schaden verursachen. Reifegradmodelle müssen Safety-Gates und Zertifizierungen (z.B. IEC 62443, IEC 61508) berücksichtigen.
Geplante Wartungsfenster
Continuous Deployment im IT-Sinne ist in der OT selten möglich. Releases erfolgen in geplanten Wartungsfenstern — oft nur alle 4–8 Wochen. Die Deployment Frequency ist daher kein geeigneter Vergleichsmaßstab mit IT-Teams.
Heterogene Toollandschaft
SPS/PLC-Code (z.B. TIA-Portal), SCADA-Konfigurationen und Edge-Gateway-Software erfordern spezialisierte CI/CD-Toolchains. Standard-IT-Tools wie GitHub Actions funktionieren hier nicht ohne Weiteres.
Angepasste Benchmarks
Ein „Elite"-OT-Team deployt nicht mehrmals täglich, sondern hat automatisierte, reproduzierbare und rücksetzbare Releases im Wartungsfenster — mit einer Change Failure Rate nahe null und vollständiger Traceability.
DORA-Metriken vs. Reifegradmodell vs. Value-Stream-Mapping
Welche Methode passt wann? Die folgende Übersicht hilft bei der Auswahl des richtigen Ansatzes für Ihr DevOps-Assessment.
| Kriterium | DORA-Metriken | Reifegradmodell | Value-Stream-Mapping |
|---|---|---|---|
| Typ | Quantitativ | Qualitativ | Prozessanalyse |
| Aufwand | Gering (Tool-basiert) | Mittel (½–2 Tage) | Hoch (1–3 Tage) |
| Ergebnis | 4 Kennzahlen + Benchmark | Level-Einordnung (1–5) | Prozess-Visualisierung + Engpässe |
| Frequenz | Kontinuierlich | Alle 6–12 Monate | Bei Bedarf / jährlich |
| Stärke | Objektiv, vergleichbar | Ganzheitlich, strategisch | Konkrete Handlungsfelder |
| Schwäche | Nur Software-Delivery | Subjektiv, kontextabhängig | Zeitintensiv, Snapshot |
Fazit: Messen ist der erste Schritt
Sie können nicht verbessern, was Sie nicht messen. DORA-Metriken liefern die harten Zahlen (die wichtigsten DevOps-KPIs), das DevOps-Reifegradmodell gibt Orientierung über alle Dimensionen und Value-Stream-Mapping zeigt die konkreten Engpässe. Zusammen bilden sie ein vollständiges Bild für Ihr DevOps-Benchmarking.
Starten Sie einfach: Erheben Sie die vier DORA-Metriken für ein Team, machen Sie ein Value-Stream-Mapping für einen Prozess und ordnen Sie sich grob im Reifegradmodell ein. Das dauert einen halben Tag — und liefert Erkenntnisse, die Ihre DevOps-Strategie auf eine solide Basis stellen. Oder nutzen Sie unseren interaktiven Online-Reifegrad-Check für eine erste Standortbestimmung in 3 Minuten.
Und dann: regelmäßig wiederholen. Quartal für Quartal — Continuous Improvement. Der Trend ist wichtiger als der absolute Wert.
Kostenloser DevOps-Reifegrad-Check
Unser interaktiver Online-Check bewertet Ihren DevOps-Reifegrad in 3 Minuten. Sie erhalten einen personalisierten Report mit Score, Benchmark-Vergleich und Top-3-Handlungsempfehlungen.
Quellen & weiterführende Ressourcen
- Accelerate State of DevOps Report 2024DORA / Google Cloud
- Accelerate: The Science of Lean Software and DevOpsForsgren, Humble, Kim (2018)
- CMMI Institute — Capability Maturity Model IntegrationISACA / CMMI Institute
- DevOps Reifegradmodell — LeitfadenComquent Academy
Häufig gestellte Fragen zur DevOps-Reifegradanalyse
Was ist eine DevOps-Reifegradanalyse?
Eine DevOps-Reifegradanalyse (auch: DevOps Maturity Assessment) bewertet systematisch, wie weit ein Unternehmen in den Bereichen Kultur, Automatisierung, Prozesse und Metriken fortgeschritten ist. Das Ergebnis ist ein objektives Bild des Ist-Zustands mit konkreten Handlungsempfehlungen für die nächsten Schritte.
Was sind die DORA-Metriken und warum sind sie wichtig?
DORA-Metriken sind vier Schlüsselkennzahlen aus dem State of DevOps Report: Deployment Frequency, Lead Time for Changes, Change Failure Rate und Mean Time to Recovery. Sie korrelieren nachweislich mit der Gesamtleistung von Softwareorganisationen und ermöglichen einen branchenübergreifenden Benchmark.
Wie führt man ein DevOps Maturity Assessment durch?
Ein Assessment umfasst typischerweise Interviews mit Stakeholdern, eine Analyse der bestehenden Toolchain und Prozesse sowie die Bewertung anhand eines Reifegradmodells. Der Prozess dauert je nach Unternehmensgröße zwischen einem halben und zwei Tagen.
Was ist Value-Stream-Mapping im DevOps-Kontext?
Value-Stream-Mapping visualisiert den gesamten Wertschöpfungsstrom von der Idee bis zum Deployment und identifiziert Wartezeiten, Engpässe und manuelle Schritte. Es zeigt konkret, wo Automatisierung und Prozessverbesserung den größten Hebel bieten.
Wie oft sollte man den DevOps-Reifegrad messen?
Eine umfassende Reifegradanalyse sollte alle sechs bis zwölf Monate durchgeführt werden, um Fortschritte zu messen und neue Verbesserungspotenziale zu identifizieren. DORA-Metriken sollten hingegen kontinuierlich getrackt werden, um schnell auf Veränderungen reagieren zu können.
Was ist ein guter DevOps-Reifegrad?
Es gibt keinen universell „guten" Reifegrad — entscheidend ist der Fortschritt relativ zum eigenen Ausgangspunkt und den Unternehmenszielen. Laut DORA-Benchmark deployen Elite-Performer mehrmals täglich mit einer Change Failure Rate unter 5 % und einer Recovery Time unter einer Stunde.
Welche Fehler sollte man bei der Reifegradmessung vermeiden?
Die häufigsten Fehler sind die Fokussierung auf Vanity-Metriken statt auf Outcome-Metriken, das Messen ohne anschließende Maßnahmen und der Vergleich mit Teams in völlig anderen Kontexten. Metriken sollten immer zur Verbesserung motivieren, nicht zur Bestrafung genutzt werden.
Gibt es einen kostenlosen DevOps-Reifegrad-Check?
Ja, Comquent bietet einen kostenlosen Online-Schnellcheck mit 10–15 Fragen an, der in drei Minuten eine erste Einschätzung Ihres DevOps-Reifegrads liefert. Für eine tiefergehende Analyse empfiehlt sich ein professionelles Assessment mit Benchmark-Vergleich und individuellen Handlungsempfehlungen.
Was kostet ein professionelles DevOps Assessment?
Die Kosten variieren je nach Umfang und Unternehmensgröße. Ein halbtägiger Quick-Scan liegt typischerweise bei 1.500–3.000 €, ein umfassendes Assessment über 1–2 Tage bei 5.000–10.000 €. Comquent bietet einen kostenlosen 90-minütigen DevOps Quick-Scan als Einstieg an.
Was ist der Unterschied zwischen DORA-Metriken und einem Reifegradmodell?
DORA-Metriken messen quantitativ die Software-Delivery-Performance anhand von vier Kennzahlen. Ein Reifegradmodell bewertet qualitativ den Gesamtzustand über alle Dimensionen — Kultur, Prozesse, Technologie und Organisation — und ordnet das Unternehmen in Stufen ein (Level 1–5). Beide Methoden ergänzen sich: DORA liefert harte Zahlen, das Reifegradmodell gibt den strategischen Überblick.
Welche Tools helfen bei der automatischen DORA-Metrik-Erfassung?
Zu den führenden Tools gehören Sleuth, LinearB, Faros AI, GitLab Value Stream Analytics, Haystack und Jellyfish. Diese integrieren sich in bestehende CI/CD-Pipelines und Git-Repositories und liefern Echtzeit-Dashboards mit Benchmark-Vergleichen.
Verwandte Artikel
DevOps-Kultur auf dem Shopfloor
CALMS-Framework, Blameless Post-Mortems und psychologische Sicherheit.
Industrial DevOps: Der komplette Leitfaden
Was ist Industrial DevOps? CI/CD für cyber-physische Systeme und Industrie 4.0.
IT/OT-Kulturwandel in der Fertigung
Warum cross-funktionale Teams die größte DevOps-Herausforderung sind.
Bereit für den nächsten Schritt?
Vereinbaren Sie ein kostenloses Erstgespräch — wir klären gemeinsam, wie Sie in 90 Tagen die ersten messbaren Industrial-DevOps-Erfolge erzielen.
Erstgespräch buchenVon Comquent-Experten beraten — seit 2006 | 47+ erfolgreiche Projekte | Industrie, Automotive, Finance
