教師なし学習
明示的な結果ガイダンスなしに、モデルがラベル付けされていないデータ内のパターンやグループを識別する機械学習アプローチ。
Definition
クラスターの凝集力や再構成誤差などの目的を最適化することにより、データ内の本質的な構造を発見する手法(クラスタリング、次元削減、異常検出など)。ガバナンスに関する考慮事項には、発見されたパターンを専門分野の専門知識と照らし合わせて検証すること、誤ったグループや偏ったグループ分けがないことを監視すること、エラーを自動的に検出するラベルが存在しないことによるデータ品質の確保などがあります。結果の検査に使用されるアルゴリズムの選択、パラメーター設定、および解釈可能性ツールを文書化する必要があります。
Real-World Example
ある小売チェーンでは、顧客の購入履歴に基づいてk-meansクラスタリングを行い、買い物客を行動ベースのグループに分類しています。アナリストは人口統計調査と照らし合わせてセグメントを検証し、クラスター数を調整して有意義なマーケティングペルソナを確保することで、データアーティファクトによる誤解を招くようなグループ分けを避けています。