データドリフト

時間の経過に伴うモデル入力データの変化。監視して対処しないと、モデルのパフォーマンスが低下する可能性があります。

Definition

季節性、ユーザーの行動の変化、または外部要因により、受信データの統計的特性がトレーニング分布から逸脱し、モデルの予測がますます不正確になる場合に発生します。効果的なドリフト管理には、自動検出 (特徴分布の比較など)、アラートの閾値の定義、パフォーマンスを回復するための再トレーニングや再調整のワークフローなどが含まれます。

Real-World Example

ある電子商取引小売業者の需要予測モデルは、予期せぬ天候の異常により、夏服の売上予測を急に下回ってしまいました。ドリフト検出器は、温度特性分布の変化にフラグを立て、最新のデータに基づいて再トレーニングを開始し、在庫切れが発生する前に予測精度を回復します。