次の方法で共有


根拠性検出

根拠性検出 API では、大規模言語モデル (LLM) のテキスト応答が、ユーザーが提供するソース資料に基づいているかどうかを検出します。 根拠なしとは、ソース資料に存在していた事実に基づかない、または不正確な情報が LLM から生成されることを指します。

キーワード

  • 取得拡張生成 (RAG): RAG は、LLM の知識を他のデータで拡張するための手法です。 LLM は幅広いトピックについて推論できますが、その知識は、トレーニング時に使用可能だったパブリック データに限定されます。 プライベート データやモデルのカットオフ日の後に導入されたデータについて推論できる AI アプリケーションを構築する場合は、その特定の情報をモデルに提供する必要があります。 適切な情報を取り込んでモデル プロンプトに挿入するプロセスは、取得拡張生成 (RAG) と呼ばれます。 詳細については、取得拡張生成 (RAG)に関するページを参照してください。
  • LLM の根拠性と根拠なし: これは、モデルの出力がどの程度、提供された情報に基づいているか、または信頼できるソースを正確に反映しているかを指します。 根拠のある応答は、与えられた情報に密接に準拠し、憶測や捏造を回避します。 根拠性の測定では、ソース情報が重要であり、根拠となるソースとして機能します。

根拠性検出オプション

Azure AI Content Safety の根拠性検出には、次のオプションを使用できます。

  • ドメインの選択: ユーザーは、確立されたドメインを選択して、各自の分野の特定のニーズに合わせた、より調整された検出を確実に行うことができます。 現在使用可能なドメインは MEDICALGENERIC です。
  • タスクの仕様: この機能を使用すると、QnA (質問と回答) や要約など、実行中のタスクを選択し、タスクの種類に応じて設定を調整できます。
  • 速度と解釈可能性: 結果の解釈可能性と速度をトレードオフする 2 つのモードがあります。
    • 非推論モード: 高速検出機能を提供します。オンライン アプリケーションに簡単に埋め込むことができます。
    • 推論モード: 検出された根拠なしセグメントについて詳細な説明を提供します。解釈と軽減策のために役立ちます。

ユース ケース

根拠性検出では、生成された要約または回答が正確で信頼性の高いものになるように、テキストベースの要約および QnA タスクがサポートされています。 それぞれのユース ケースの例をいくつか示します。

要約タスク:

  • 医療の要約: 医療ニュース記事のコンテキストで根拠性検出を使用して、要約に捏造された情報や誤解を招く情報が含まれていないことを確認し、読者が正確で信頼性の高い医療情報を得られるようにすることができます。
  • 学術論文の要約: モデルで学術論文または研究記事の要約を生成する場合、この機能は、要約された内容が誤った主張を導入することなく、重要な発見や貢献を正確に表すことを保証するのに役立ちます。

QnA タスク:

  • カスタマー サポート チャットボット: カスタマー サポートはこの機能を使用して、AI チャットボットによって提供される回答を検証します。これにより、顧客は製品やサービスに関する質問をしたときに、正確な信頼できる情報を確実に受け取ることができます。
  • 医療 QnA: 医療 QnA の場合、この機能は、AI システムによって医療従事者や患者に提供される医療に関する回答や助言の正確さを検証し、医療過誤のリスクを軽減するのに役立ちます。
  • 教育用 QnA: 教育現場では、この機能を QnA タスクに適用して、学術的な質問やテスト準備の質問に対する回答が事実として正確であることを確認し、学習プロセスをサポートできます。

根拠性修正

根拠性検出 API には、提供された根拠となるソースに基づいて、テキスト内で検出された根拠付けられていないテキストを自動的に修正する修正機能が組み込まれています。 修正機能が有効になっている場合、応答には、根拠となるソースに合わせて修正されたテキストを提示する corrected Text フィールドが含まれます。

ユース ケース

以下では、これらの機能を適用して最適な結果を得る方法と適用のタイミングを示す一般的なシナリオをいくつか示します。

医療コンテキストでの要約

あなたは医療ドキュメントを要約しており、要約の中で患者の名前が正確であり、要約が提供されている根拠となるソースと一致していることが重要です。

API 要求の例は次のとおりです。

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

予想される結果:

修正機能は、Kevin が根拠となるソース Jane と競合しているために、根拠付けられていないことを検出します。 この API は、次の修正されたテキストを返します。"The patient name is Jane."

カスタマー サポート データを含む質問と回答 (QnA) タスク

あなたはカスタマー サポート チャットボット用の QnA システムを実装しています。 AI によって提供される回答は、利用可能な最新の正確な情報と一致することが極めて重要です。

API 要求の例は次のとおりです。

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

予想される結果:

この API は、5% が、提供された根拠となるソース 4.5% と一致しないため、根拠付けられていないことを検出します。 応答に、次の修正テキストが含まれます。"The interest rate is 4.5%."

履歴データを使用したコンテンツの作成

履歴データやイベントを含むコンテンツを作成しています。このコンテンツでは、信頼性を維持し、誤った情報を避けるために精度が重要です。

API 要求の例は次のとおりです。

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

予想される結果:

この API は、1065 が根拠付けられていない日付であることを検出し、根拠となるソースに基づいて 1066 に修正します。 応答に、次の修正されたテキストが含まれます。"The Battle of Hastings occurred in 1066."

内部ドキュメントの要約

製品名、バージョン番号、またはその他の特定のデータ ポイントの整合性を維持する必要がある内部ドキュメントを要約しています。

API 要求の例は次のとおりです。

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

予想される結果:

修正機能は、SuperWidget v2.1 を根拠付けられていないデータとして識別し、これを応答の中で SuperWidget v2.2 に更新します。 応答で、次の修正されたテキストが返されます。"Our latest product is SuperWidget v2.2."

ベスト プラクティス

根拠性検出 API から最大限のパフォーマンスを得るために RAG システムを設定する場合は、次のベスト プラクティスに従ってください。

  • 製品名またはバージョン番号を扱うときは、直接内部リリース ノートまたは公式の製品ドキュメントからの根拠となるソースを使用して、正確性を確保します。
  • 履歴コンテンツの場合は、信頼できる学術データベースまたは履歴データベースを使用して根拠となるソースを相互参照し、最高レベルの正確性を確保します。
  • 財務のような動的な環境では、常に最新の信頼性の高い根拠となるソースを使用して、AI システムが正確でタイムリーな情報を提供できるようにします。
  • 特に医療などの機密性の高い分野では、根拠となるソースが正確で最新であることを常に確認してください。 これにより、要約作成プロセスでのエラーのリスクが最小限に抑えられます。

制限事項

利用できる言語

現在、Groundedness detection API は英語のコンテンツをサポートしています。 Microsoft の API では、英語以外のコンテンツの送信が制限されていませんが、その他の言語のコンテンツの分析において同じレベルの品質と正確性を保証することはできません。 API からの最も信頼性が高く正確な結果を保証するために、ユーザーは主に英語でコンテンツを送信することをお勧めします。

テキストの長さの制限事項

最大テキスト長の制限については、「入力要件」を参照してください。

利用可能なリージョン

この API を使用するには、対応しているリージョン内に Azure AI Content Safety リソースを作成する必要があります。 利用可能なリージョンに関するページを参照してください。

レートの制限事項

クエリ速度」を参照してください。

より高いレートが必要な場合は、お問い合わせいただき、リクエストしてください。

次のステップ

根拠性を検出するために、Azure AI Content Safety の使用を開始する方法については、クイックスタートに従ってください。