Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Wenn der Agent um drei Uhr nachts das Zertifikat erneuert

SRE-Agents sollen das erledigen, wofür früher ein Mensch aus dem Tiefschlaf geklingelt wurde. Marc Müller erklärt, wie das funktioniert, warum ein Agent eine eigene Identität braucht und wo die Grenze zwischen sinnvoller Automatisierung und gefährlichem Freifahrtschein liegt.

Der Begriff klingt nach Akronym kurz vor Buzzword. SRE-Agent. Aber Marc Müller, Principal Consultant bei 4tecture und Microsoft MVP für Developer Technologies, hat eine ziemlich nüchterne Erklärung dafür: Ein SRE-Agent ist ein KI-basierter Agent, der die Rolle des Site Reliability Engineers übernimmt, also das Überwachen, Betreiben und Wiederherstellen von Systemen. Die Rolle kennen wir. Jetzt gibt es sie auch ohne Mensch dahinter.

Was neu ist, ist der Mechanismus. Solche Agents arbeiten in einem Agent-Loop: Sie bekommen eine Aufgabe, nutzen Tools, überprüfen, ob das Ergebnis stimmt, korrigieren nach. Getriggert werden sie über Alerts, Log-Files oder ganz klassisch per Cron-Job. Alle zehn Minuten: System in Ordnung? Wenn nicht, was ist zu tun?

Das klingt nach Automatisierung, wie wir sie kennen. Aber der Unterschied zu klassischen Monitoring-Scripts ist erheblich. Ein SRE-Agent analysiert nicht nur, er entwickelt einen Plan. Er kann Fehler identifizieren, Lösungsschritte ableiten und im nächsten Schritt entweder einen Ticket-Eintrag erzeugen oder direkt handeln. Ob er handeln darf, ist die entscheidende Frage.

Vertrauen ist gut ...

Marc Müller ist da klar: Unkontrollierte Autonomie ist keine Option. Ein Agent, dem man einfach alle Berechtigungen gibt und ihn loslaufen lässt, ist ein Risiko. Was dagegen hilft: eine eigene Identität für den Agent, mit sauber zugeschnittenen Berechtigungen per Role-Based Access Control. Dazu kommen Runbooks, also schrittweise Anleitungen für konkrete Problemsituationen, und Skills, feingranulare Prompt-Files, die aktiviert werden, wenn ein bestimmtes Problem erkannt wird. Kubernetes-Pod rot? Skill für genau das. DB-Connectivity-Issue? Anderer Skill.

Wo zieht Müller die Grenze bei der Autonomie? Zertifikat erneuern, Service neu starten, ein Deployment starten: kein Problem, weil reversibel. Produktivdatenbank anfassen oder die Cloud-Architektur umbauen: niemals autonom. Der Agent soll in solchen Fällen beschreiben, was er tun würde, und das Team entscheiden lassen.

Was das für die Arbeit der SRE-Kolleg:innen bedeutet? Weniger Nachtschichten wegen abgelaufener Zertifikate. Mehr Zeit für die Probleme, die wirklich Nachdenken erfordern. Und eine neue Kernkompetenz: Markdowns schreiben. Wer einem SRE-Agent beibringt, wie er in welcher Situation vorzugehen hat, schreibt keine Shell-Scripts mehr, sondern strukturierte Anweisungen in natürlicher Sprache, die versioniert, weiterentwickelt und ins Repository eingecheckt werden.

Marc Müller spricht auf der DWX 2026 unter anderem über Self-Healing Systems und zeigt, wie sich ein SRE-Agent in der Praxis konfigurieren und betreiben lässt.

 

DWX 2026, 29. Juni bis 2. Juli 2026, Mannheim. https://www.developer-world.de/dwx

Marc Müller ist Principal Consultant für DevOps- und .NET/Azure-Lösungen bei der 4tecture GmbH und wird von Microsoft als Most Valuable Professional (MVP) für Developer Technologies (Azure DevOps) ausgezeichnet. In zahlreichen Projekten hat er sein DevOps-Know-how für Enterprise-Architekturen und komponentenbasierte verteilte Systeme eingebracht. Als Trainer und Speaker liegt sein Schwerpunkt auf der Ausbildung und dem Coaching von DevOps- und .NET-Projektteams.

Neueste Beiträge

Maschinelles Lernen in .NET - .NET, Python und KI, Teil 2
Für eine performante und plattformübergreifende Inferenz von NET-Projekten empfiehlt sich eine hybride Strategie aus Training oder Prototyping in Scikit-Learn/Python, Export nach ONNX und Einbindung in .NET über ML.NET oder ONNX Runtime.
7 Minuten
Volltextsuche mit SQLite: FTS5 und Fuzzy Search - SQLite für .NET-Entwickler, Teil 4
Hochperformante Suche ohne externe Suchmaschine? Wie man mit der in SQLite eingebauten Volltextsuch-Engine FTS5 eine effiziente Suche mit Tippfehlertoleranz implementiert – und in welchen Fällen Elasticsearch doch die bessere Wahl ist.
6 Minuten
22. Apr 2026
Python in .NET – Integration mit Python.NET - .NET, Python und KI, Teil 1
Python-Code lässt sich in .NET-Anwendungen mit dem Open-Source-Projekt Python.NET einbinden. Wir erklären die Installation und grundlegende Interop-Szenarien. Ein einfaches Beispiel veranschaulicht die Praxis.
6 Minuten

Das könnte Dich auch interessieren

00:00
MCP: Der USB-C-Stecker für Deine KI-App - Model Context Protocol auf der DWX
Jonah Andersson bringt es auf den Punkt: Das Model Context Protocol ist kein Hype-Buzzword, sondern eine echte Hilfe für .NET-Entwickler:innen. Wer MCP richtig einsetzt, spart sich aufwändige Integrationsarbeit – und behält trotzdem die Kontrolle über die eigene Business-Logik.
7. Apr 2026
Infinite AI Conference: So setzt Du KI in jedem Schritt des Software-Lifecycle ein - KI gehört in Deinen Workflow
Von den Anforderungen über Design, Implementierung bis zum Testen, Deployment und Monitoring: Auf der Infinite AI Conference 2026 erfährst Du, wie Dich die KI im gesamten Lifecycle unterstützen kann.
4 Minuten
00:00
Vibe Coding war gestern – Vise Coding ist die Zukunft - KI-gestützte Softwareentwicklung
Der Begriff Vibe Coding geistert durch die Branche – aber was steckt wirklich dahinter? Gregor Biswanger erklärt im DWX-Interview, warum nicht alle KI-Agenten-Workflows gleich sind, wo Vise Coding den Unterschied macht und warum die Branche gerade eine ziemlich wilde Dating-Show erlebt.
31. Mär 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige