機能エンジニアリング
未処理のデータセット属性を作成、選択、または機械学習モデルのパフォーマンスを向上させる機能に変換する。
Definition
多項式の特徴の作成、カテゴリカル変数のエンコード、交互作用項の構築、または分布の正規化など、ドメインデータ(タイムスタンプ、テキスト、センサーの読み取り値)を意味のある入力に変換する技術と科学。優れた特徴量エンジニアリングは、モデルの複雑さを軽減し、解釈可能性を高め、ドメインの知識を組み込むことができます。ガバナンスでは、特徴系統を追跡し、変換を検証し、特徴ドリフトがモデルの公平性に与える影響を評価する必要があります。
Real-World Example
小売分析チームは、取引日から「days_since_last_purchase」を、売上ログから「平均消費額_訪問回数」を計算します。これらの機能により、顧客離れモデルのリコール率が 70% から 85% に大幅に向上し、明確な文書化により、データガバナンス監査により、エンジニアリングされた各分野を未加工の情報源までさかのぼって追跡できるようになります。