Der Begriff klingt nach Akronym kurz vor Buzzword. SRE-Agent. Aber Marc Müller, Principal Consultant bei 4tecture und Microsoft MVP für Developer Technologies, hat eine ziemlich nüchterne Erklärung dafür: Ein SRE-Agent ist ein KI-basierter Agent, der die Rolle des Site Reliability Engineers übernimmt, also das Überwachen, Betreiben und Wiederherstellen von Systemen. Die Rolle kennen wir. Jetzt gibt es sie auch ohne Mensch dahinter.
Was neu ist, ist der Mechanismus. Solche Agents arbeiten in einem Agent-Loop: Sie bekommen eine Aufgabe, nutzen Tools, überprüfen, ob das Ergebnis stimmt, korrigieren nach. Getriggert werden sie über Alerts, Log-Files oder ganz klassisch per Cron-Job. Alle zehn Minuten: System in Ordnung? Wenn nicht, was ist zu tun?
Das klingt nach Automatisierung, wie wir sie kennen. Aber der Unterschied zu klassischen Monitoring-Scripts ist erheblich. Ein SRE-Agent analysiert nicht nur, er entwickelt einen Plan. Er kann Fehler identifizieren, Lösungsschritte ableiten und im nächsten Schritt entweder einen Ticket-Eintrag erzeugen oder direkt handeln. Ob er handeln darf, ist die entscheidende Frage.
Vertrauen ist gut ...
Marc Müller ist da klar: Unkontrollierte Autonomie ist keine Option. Ein Agent, dem man einfach alle Berechtigungen gibt und ihn loslaufen lässt, ist ein Risiko. Was dagegen hilft: eine eigene Identität für den Agent, mit sauber zugeschnittenen Berechtigungen per Role-Based Access Control. Dazu kommen Runbooks, also schrittweise Anleitungen für konkrete Problemsituationen, und Skills, feingranulare Prompt-Files, die aktiviert werden, wenn ein bestimmtes Problem erkannt wird. Kubernetes-Pod rot? Skill für genau das. DB-Connectivity-Issue? Anderer Skill.
Wo zieht Müller die Grenze bei der Autonomie? Zertifikat erneuern, Service neu starten, ein Deployment starten: kein Problem, weil reversibel. Produktivdatenbank anfassen oder die Cloud-Architektur umbauen: niemals autonom. Der Agent soll in solchen Fällen beschreiben, was er tun würde, und das Team entscheiden lassen.
Was das für die Arbeit der SRE-Kolleg:innen bedeutet? Weniger Nachtschichten wegen abgelaufener Zertifikate. Mehr Zeit für die Probleme, die wirklich Nachdenken erfordern. Und eine neue Kernkompetenz: Markdowns schreiben. Wer einem SRE-Agent beibringt, wie er in welcher Situation vorzugehen hat, schreibt keine Shell-Scripts mehr, sondern strukturierte Anweisungen in natürlicher Sprache, die versioniert, weiterentwickelt und ins Repository eingecheckt werden.
Marc Müller spricht auf der DWX 2026 unter anderem über Self-Healing Systems und zeigt, wie sich ein SRE-Agent in der Praxis konfigurieren und betreiben lässt.
DWX 2026, 29. Juni bis 2. Juli 2026, Mannheim. https://www.developer-world.de/dwx
Marc Müller ist Principal Consultant für DevOps- und .NET/Azure-Lösungen bei der 4tecture GmbH und wird von Microsoft als Most Valuable Professional (MVP) für Developer Technologies (Azure DevOps) ausgezeichnet. In zahlreichen Projekten hat er sein DevOps-Know-how für Enterprise-Architekturen und komponentenbasierte verteilte Systeme eingebracht. Als Trainer und Speaker liegt sein Schwerpunkt auf der Ausbildung und dem Coaching von DevOps- und .NET-Projektteams.