Kreuzvalidierung
Eine Modellvalidierungstechnik zur Bewertung, wie die Ergebnisse einer statistischen Analyse auf einen unabhängigen Datensatz verallgemeinert werden.
Definition
Beinhaltet die Partitionierung von Daten in k Faltungen, das Training an K-1-Faltungen und das Testen an der ausgehaltenen Faltung; k mal wiederholen. Dies liefert solide Schätzungen der Modellgeneralisierung und deckt Überanpassungen auf. Zu den Anwendungsfällen im Bereich Governance gehören die teamübergreifende Standardisierung von Kreuzvalidierungsprotokollen (Foldgröße, zufällige Startwerte) und die Dokumentation der Ergebnisse für Compliance-Audits.
Real-World Example
Ein Marketinganalyseteam verwendet eine 10-fache Kreuzvalidierung seines Kundenabwanderungsmodells. Jede Faltung ergibt AUC-Werte; sie melden den Mittelwert und die Varianz den Stakeholdern. Wenn die Varianz hoch ist, sammeln sie zusätzliche Daten, anstatt ein Modell mit instabiler Leistung bereitzustellen.