Xバリデーション

データを分割してモデルの汎化を厳密に評価し、過適合を検出するモデル検証手法 (「X-Val」と略されることが多い)。

Definition

データセットをk個のサブセットに分割するk分割クロス検証法。モデルはk—1分割でトレーニングされ、残りの分割で検証され、各サブセットが検証として1回使用されるように反復処理されます。これにより、サンプル外のパフォーマンスと分散の確実な推定が可能になり、ガバナンスチームがパフォーマンスの閾値を設定し、過適合を検出し、モデルの準備状況を判断するのに役立ちます。結果(全分割にわたる平均と標準偏差)は検証レポートに記録されます。

Real-World Example

あるマーケティング分析チームは、顧客離れモデルに10倍のX-Validationを適用し、平均AUCは0.87±0.02と報告しています。分散が小さいことは、一般化が安定していることを示しています。これらの結果は、本番環境への導入前に AI ガバナンスオフィスが必要とする正式な検証レポートに含まれています。