バージョンコントロール
再現性と監査可能性を確保するために、AI コード、モデル、データセットへの変更を長期にわたって管理および追跡する慣行。
Definition
コードにはGit、データにはDVCやLakeFS、アーティファクトバージョンにはモデルレジストリツールなどのシステムを使用する必要があります。機能エンジニアリングスクリプト、ハイパーパラメーター設定、データセットスナップショット、トレーニング済みモデルバイナリなど、すべての変更にタグが付けられ、文書化されます。バージョン管理により、ロールバック、実験のためのブランチ管理、生産モデルの導出方法の完全なトレーサビリティが可能になります。
Real-World Example
金融サービスチームは、前処理コードを Git に保存し、未処理のデータセットとクリーンアップされたデータセットを DVC 経由で追跡し、トレーニング済みの各モデルをパラメーターと入力データバージョンとともに MLflow に登録します。異常が発生しても、以前のモデルバージョンをそのまま再現できるため、デバッグとコンプライアンスの監査の両方に役立ちます。