推論

トレーニング済みの AI モデルが、新しいデータ入力を処理して予測や意思決定を行うプロセス。

Definition

モデルが学習したパラメーターを目に見えないデータに適用するランタイムステージ。多くの場合、レイテンシー、スループット、リソースに厳しい制約があります。推論ガバナンスにより、プロダクションモデルが正しいバージョンを使用し、パフォーマンスSLAを遵守し、入出力をモニタリング用に記録し、入力検証チェックを実施して悪用やインジェクション攻撃を防止することが保証されます。

Real-World Example

不正検出サービスは、推論用に REST API を公開します。モデルをマイクロサービスに包み込んで、入力スキーマを検証し、すべてのリクエストとレスポンスをメタデータで記録し、トランザクション負荷のピーク時には応答時間が 100 ミリ秒未満になるように水平方向にスケーリングします。