ゼロショット学習

一般化された知識表現を活用して、タスクを正しく処理したり、明示的にトレーニングされたことのないデータを分類したりするモデル機能。

Definition

共有されたセマンティックまたは機能の埋め込みに基づいて、モデルが既知のクラスと新しいクラスとの関係を推論できるようにする手法(大規模言語モデルにおけるプロンプトエンジニアリング、属性ベースの分類器など)。ガバナンスに関する考慮事項には、代表的なホールドアウトカテゴリーでのゼロショット性能の検証、予期しない誤分類の監視、目に見えないインプットに対する信頼度が低い場合のフォールバック手順の確立などがあります。

Real-World Example

大規模な言語モデルに基づいて構築されたカスタマーサポートチャットボットは、「サブスクリプションのアップグレード」に関する質問を、セマンティックインテントと利用可能なカテゴリを照合することで、そのラベルに関するトレーニングを受けていなくても、ゼロショット分類を使用してルーティングします。システムには、信頼性の低いゼロショットルーティングが記録され、人間による確認が可能になり、新しい問い合わせにも正しく処理されるようになります。