機能選択

モデルトレーニングに最も関連する機能を特定して選択することで、複雑さを軽減し、精度を向上させることができます。

Definition

統計的指標 (相互情報、相関)、モデルベースの重要度スコア、またはラッパー法 (再帰的特徴除去) に基づいて特徴をランク付けまたはフィルタリングするプロセス。特徴を適切に選択することで、過剰適合が減り、学習時間が短縮され、説明が容易になります。ガバナンスガイドラインでは、選択基準を文書化し、機密属性が誤って漏洩しないようにし、データの変化に合わせて選択を再評価することが求められています。

Real-World Example

信用リスクモデリングでは、データサイエンスチームがL1正規化と順列重要度分析を使用して、影響の少ない変数(例:マイナーな人口統計フィールド)の40%を削除します。結果として得られるモデルは、トレーニング時間が 30% 短縮され、パフォーマンスが維持され、監査人によるレビューも容易になります。