KI-Agenten
Guardrails, Confidence-Schwellenwert, Audit-Log, Kill Switch. Standardmäßig.
Sicherheit ist kein nachträglicher Patch – sie ist die Art und Weise, wie wir den Agenten von der ersten Codezeile an entwickeln.

Kurzgefasst
Ein sicherer autonomer Agent verfügt über: minimale Berechtigungen für Anmeldeinformationen, einen Confidence-Schwellenwert, unter dem er an einen Menschen eskaliert, ein unveränderliches Audit-Log für jede Aktion, einen „Shadow“-Modus, in dem er Vorschläge macht, ohne sie auszuführen, sowie einen globalen Kill Switch. Der Übergang zur vollständigen Autonomie erfolgt schrittweise, basierend auf Daten – nicht auf blindem Vertrauen.
- Geringste Privilegien für die Anmeldeinformationen des Agenten
- Konfigurierbarer Confidence-Schwellenwert pro Aktion
- Unveränderliches, vollständiges, abfragbares Audit-Log
- Shadow-Modus → Human-in-the-Loop → schrittweise Autonomie
Die 5 Sicherheitsebenen, standardmäßig
Bei jeder Implementierung integrieren wir von Anfang an:
- Dedizierte Anmeldeinformationen mit minimalen Rechten (nicht „Admin“)
- Explizit definierte erlaubte Aktionen (Allowlist, nicht Blocklist)
- Confidence-Schwellenwert – darunter wird an einen Menschen eskaliert
- Unveränderliches Audit-Log für jede Entscheidung und Aktion
- Globaler Kill Switch + Möglichkeit zum Rollback bei reversiblen Aktionen
Wie wir schrittweise zur Autonomie übergehen
Woche 1–2: Shadow-Modus (der Agent schlägt vor, der Mensch entscheidet alles). Woche 3–4: Human-in-the-Loop bei Aktionen mit Auswirkungen, autonom bei den restlichen. Woche 5+: Schrittweise Ausweitung der Autonomie, nur dort, wo die gemessene Genauigkeit dies rechtfertigt. Nichts „auf Vertrauen“ – alles auf Daten basierend.
Was tun wir, wenn der Agent einen Fehler macht?
Fehler werden erwartet, nicht überrascht. Das Audit-Log ermöglicht eine schnelle Ursachenanalyse, einen Rollback, wo möglich, eine Anpassung der Schwellenwerte und ein erneutes Training für den jeweiligen Fall. Unsere Kultur: Fehler werden zu Input, nicht zu Schuldzuweisungen.