アンダーフィッティング
AIシステムが単純すぎて基礎となるデータパターンをキャプチャできないため、トレーニングと新しいデータの両方でパフォーマンスが低下するモデリングの問題。
Definition
モデルの複雑さ (パラメーターが少なすぎる、正則化が強すぎるなど) により真の関係の学習が妨げられ、トレーニングや検証の誤差が大きくなる場合に発生します。ガバナンスの実践には、バージョン管理と検証ゲートを通じて変更の追跡とレビューを確実に行いながら、トレーニングと検証の両方の損失を監視し、許容できるエラー閾値を設定し、不適合が解消されるまでモデルの容量や機能の複雑さを繰り返し増やすことが含まれます。
Real-World Example
単純な線形回帰として構築された需要予測モデルでは、履歴データとホールドアウトデータの両方で 10% の誤差が見られ、これは適合が不十分であることを示しています。チームは多項式の特徴を繰り返し追加してランダムフォレストモデルに切り替え、展開前の誤差を 3% に減らしました。