X-Validierung

Eine Methode zur Modellvalidierung (oft als „X-Val“ abgekürzt), bei der Daten in Falten aufgeteilt werden, um die Modellgeneralisierung genau zu bewerten und Überanpassungen zu erkennen.

Definition

Eine k-fache Kreuzvalidierungsmethode, bei der der Datensatz in k Teilmengen aufgeteilt wird; das Modell wird anhand der K-1-Faltung trainiert und anhand der verbleibenden Faltung validiert, wobei iteriert wird, sodass jede Teilmenge einmal als Validierung dient. Dies liefert zuverlässige Schätzungen der Leistung und Varianz außerhalb der Stichprobe und hilft den Führungsteams dabei, Leistungsschwellenwerte festzulegen, Überanpassungen zu erkennen und zu entscheiden, ob das Modell reif ist. Die Ergebnisse — Mittelwert und Standardabweichung in allen Bereichen — werden in Validierungsberichten dokumentiert.

Real-World Example

Ein Marketinganalyseteam wendet die 10-fache X-Validierung auf sein Kundenabwanderungsmodell an und meldet eine durchschnittliche AUC von 0,87 ± 0,02. Die geringe Varianz deutet auf eine stabile Generalisierung hin. Diese Ergebnisse sind in dem formellen Validierungsbericht enthalten, den das AI Governance Office vor der Serieneinführung vorlegen muss.