解釈可能性

人間がAIモデルの内部メカニズムや意思決定の根拠をどの程度理解できるか。

Definition

モデルの構造に固有の透明性を指します。たとえば、特徴の影響が出力に直接反映される線形モデルやデシジョンツリーなどです。解釈可能性ガバナンスは、リスクの高いユースケースの解釈可能なモデルを奨励し、モデルロジックを明確に文書化し、不透明なモデルをリスクの低いドメインに限定するか、事後的な説明方法と組み合わせます。

Real-World Example

クレジット・スコアリング・チームは、各分割を直接解釈できる(「収入 > 5万ドル」)ため、最初の融資承認にはデシジョン・ツリー・モデルを採用します。このツリーロジックを利害関係者に公開することで、完全な解釈可能性を確保し、規制当局による審査を円滑に進めることができます。