モデル検証
AIモデルがその意図された目的とパフォーマンス基準を満たしていることを確認する評価活動(ホールドアウトデータに対するテスト、ストレスシナリオなど)。
Definition
導入前の一連のチェックには、目に見えないデータのバックテスト、極端または敵対的な条件下でのストレステスト、公平性評価とキャリブレーション評価、感度分析が含まれます。検証レポートには、方法論、結果、および制限事項が記載されています。ガバナンスには、独立した検証者、明確な検証基準、および製品リリース前の正式な承認が必要です。
Real-World Example
クレジット・スコアリング・モデルは、独立したチームによる検証を受けます。2か月間のホールドアウト・セットでテストし、景気後退シナリオをシミュレートし、所得階層全体の公平性を評価し、実際の利用が承認される前に、パフォーマンスと公平性の指標が銀行の政策基準を満たしていることを証明します。