Überwachung der Verfügbarkeit

Kontinuierliche Verfolgung der Verfügbarkeit und Leistung von KI-Systemen, um Ausfälle oder Beeinträchtigungen zu erkennen, die sich auf kritische Abläufe oder Compliance-Verpflichtungen auswirken könnten.

Definition

Eine kritische Zuverlässigkeitspraxis, bei der Service-Level-Metriken (Prozentsatz der Verfügbarkeit, durchschnittliche Zeit bis zur Wiederherstellung, Fehlerrate) über Endpunkte zur Gesundheitsprüfung, synthetische Transaktionen und Infrastrukturtests erfasst werden. Warnmeldungen und automatische Failover-Mechanismen sorgen für eine schnelle Reaktion auf Serviceunterbrechungen. Die Unternehmensleitung definiert akzeptable SLAs, die Aufbewahrung von Verfügbarkeitsprotokollen zur Streitbeilegung und regelmäßige Übungen, um Wiederherstellungsprozesse zu testen.

Real-World Example

Eine API zur Betrugserkennung verfolgt jede Minute eine Verfügbarkeit von 99,9% anhand synthetischer Testtransaktionen. Bei Erkennung einer fehlgeschlagenen Antwort werden automatische Warnmeldungen an den Bereitschaftstechniker weitergeleitet und der Datenverkehr an einen Hot-Standby-Cluster umgeleitet. So wird ein kontinuierlicher Betrugsschutz für Bankkunden gewährleistet.