メタデータ管理
トレーサビリティと監査をサポートするために、記述データ(データの出所、機能の定義、モデルパラメータなど)を収集して維持する手法。
Definition
系統情報 (ソースデータセット、変換ステップ)、機能カタログ (定義、データタイプ)、モデルアーティファクト (ハイパーパラメーター、トレーニングコードバージョン)、および使用ログを収集するメタデータレジストリの実装。ガバナンスは、パイプラインの各段階で必須のメタデータの収集を実施し、メタデータの検証チェックを統合し、利害関係者が監査や影響分析を実施するための検索および報告インターフェイスを提供します。
Real-World Example
製薬業界の ML プラットフォームでは、メタデータストアを使用して、データセットのバージョン、機能エンジニアリングスクリプト、モデルトレーニング Git コミット、デプロイタイムスタンプを記録します。モデルのパフォーマンスが低下すると、調査員はメタデータストアに問い合わせて、原因となる正確なデータまたはコード変更を特定します。