Modellvalidierung

Die Bewertungsaktivitäten (z. B. Tests anhand von Hold-Out-Daten, Stressszenarien), die bestätigen, dass ein KI-Modell seinen beabsichtigten Zweck und seine Leistungskriterien erfüllt.

Definition

Eine Reihe von Kontrollen vor dem Einsatz, darunter: Rücktests mit unsichtbaren Daten, Stresstests unter extremen oder widrigen Bedingungen, Fairness- und Kalibrierungsbewertungen sowie Sensitivitätsanalysen. In den Validierungsberichten werden Methoden, Ergebnisse und etwaige Einschränkungen dokumentiert. Die Unternehmensführung erfordert unabhängige Prüfer, klare Validierungskriterien und eine formelle Freigabe vor der Produktionsfreigabe.

Real-World Example

Ein Bonitätsbewertungsmodell wird von einem unabhängigen Team validiert: Sie testen es an einem zweimonatigen Haltezeitraum, simulieren Konjunkturabschwungsszenarien, bewerten die Fairness in allen Einkommensklassen und bescheinigen, dass die Leistungs- und Fairnesskennzahlen den geldpolitischen Schwellenwerten der Bank entsprechen, bevor es für den Live-Einsatz zugelassen wird.