Datendrift
Die Änderung der Modelleingabedaten im Laufe der Zeit, die zu einer Verschlechterung der Modellleistung führen kann, wenn sie nicht überwacht und behoben wird.
Definition
Tritt auf, wenn sich die statistischen Eigenschaften eingehender Daten aufgrund von Saisonalität, Änderungen des Nutzerverhaltens oder externer Faktoren von der Trainingsverteilung entfernen, wodurch Modelle zunehmend ungenaue Vorhersagen treffen. Zu einem effektiven Drift-Management gehören automatische Erkennung (z. B. Vergleich von Merkmalsverteilungen), definierte Schwellenwerte für Warnmeldungen und Neutraining oder Neukalibrierung von Workflows zur Wiederherstellung der Leistung.
Real-World Example
Das Nachfrageprognosemodell eines E-Commerce-Einzelhändlers prognostiziert aufgrund einer unerwarteten Wetteranomalie plötzlich den Verkauf von Sommerkleidung. Ein Drift-Detektor weist auf Veränderungen in der Verteilung der Temperaturmerkmale hin, veranlasst das Training anhand aktueller Daten und stellt die Prognosegenauigkeit wieder her, bevor es zu Fehlbeständen kommt.