Dérive des données

L'évolution des données d'entrée du modèle au fil du temps, qui peut entraîner une dégradation des performances du modèle si elle n'est pas surveillée et traitée.

Définition

Se produit lorsque les propriétés statistiques des données entrantes s'éloignent de la distribution d'apprentissage, en raison de la saisonnalité, de changements de comportement des utilisateurs ou de facteurs externes, ce qui amène les modèles à émettre des prévisions de plus en plus inexactes. Une gestion efficace de la dérive inclut la détection automatique (par exemple, la comparaison des distributions de fonctionnalités), des seuils définis pour les alertes et des flux de travail de réentraînement ou de recalibrage pour rétablir les performances.

Exemple concret

Le modèle de prévision de la demande d'un détaillant en ligne sous-estime soudainement les ventes de vêtements d'été en raison d'une anomalie météorologique inattendue. Un détecteur de dérive signale le changement dans la distribution des caractéristiques de température, déclenche un nouvel entraînement sur la base de données récentes et rétablit la précision des prévisions avant les ruptures de stock.