大規模言語モデルトークンを使用するためのメトリックを送信する

[アーティクル]
10/02/2024

適用対象: すべての API Management レベル

llm-emit-token-metric ポリシーは、LLM API を介した大規模言語モデル (LLM) トークンの使用に関するカスタムメトリックを Application Insights に送信します。トークン数のメトリックには、合計トークン、プロンプトトークン、完了トークンが含まれます。

Note

現在、このポリシーはプレビュー段階です。

Note

ポリシーの要素と子要素を、ポリシーステートメントで指定された順序で設定します。 API Management ポリシーを設定または編集する方法について説明します。

サポートされているモデル

Azure AI Model Inference API を通じて利用可能な Azure API Management に追加された LLM API でポリシーを使用します。

カスタムメトリックの制限

Azure Monitor では、API Management からメトリックを出力する機能に影響を与える可能性があるカスタムメトリックに対して使用制限が課されます。たとえば、現在 Azure Monitor では、メトリックあたりで 10 ディメンションキーの制限と、サブスクリプション内のリージョンあたりでアクティブな時系列に合計 50,000 の制限 (12 時間以内) が設定されています。

これらの制限により、API Management ポリシーでカスタムメトリック (emit-metric や azure-openai-emit-token-metric など) を構成する場合に次のような影響があります。

ポリシーごとに最大 10 のカスタムディメンションを構成できます。
12 時間以内にポリシーで生成されるアクティブな時系列の数は、期間中に構成された各ディメンションで一意な値の数の積です。たとえば、ポリシーで 3 つのカスタムディメンションが構成され、各ディメンションが期間内に 10 の使用可能な値を持つ場合、ポリシーは 1,000 (10 x 10 x 10) のアクティブな時系列を提供します。
サブスクリプション内の同じリージョンにある複数の API Management インスタンスでポリシーを構成した場合、すべてのインスタンスがリージョンのアクティブな時系列の制限に影響します。

Azure Monitor のカスタムメトリックに関する設計上の制限事項と考慮事項の詳細については、こちらを参照してください。

前提条件

1 つ以上の LLM API を API Management インスタンスに追加する必要があります。
API Management インスタンスを Application Insights と統合する必要があります。詳細については、「Azure API Management と Azure Application Insights を統合する方法」を参照してください。
LLM API で Application Insights ログを有効にする
Application Insights でディメンションを使用してカスタムメトリックを有効にします。詳細については、「カスタムメトリックを出力する」を参照してください。

ポリシーステートメント

<llm-emit-token-metric
        namespace="metric namespace" >      
        <dimension name="dimension name" value="dimension value" />
        ...additional dimensions...
</llm-emit-token-metric>

属性

属性	説明	必須	規定値
namespace	文字列。メトリックの名前空間。ポリシー式は使用できません。	いいえ	API Management

要素

要素	説明	必須
dimension	メトリックに含まれるディメンションごとに、これらの要素を 1 つ以上追加します。	はい

dimension の属性

属性	説明	必須	既定値
name	文字列またはポリシー式。ディメンションの名前。	はい	該当なし
value	文字列またはポリシー式。ディメンションの値。省略できるのは、`name` が既定のディメンションのいずれかと一致する場合のみです。その場合、ディメンション名に従って値が指定されます。	いいえ	該当なし

値なしで使用できる既定のディメンション名

API ID
操作 ID
Product ID
User ID
サブスクリプション ID
場所
ゲートウェイ ID

使用方法

ポリシーセクション: inbound
ポリシースコープ: グローバル、ワークスペース、製品、API、操作
ゲートウェイ: クラシック、v2、従量課金、セルフホステッド、ワークスペース

使用上の注意

このポリシーは、ポリシー定義ごとに複数回使用できます。
このポリシーには、最大 10 個のカスタムディメンションを構成できます。
使用可能な場合は、LLM API からの応答の使用状況セクションの値を使用してトークンメトリックを判別します。
特定の LLM エンドポイントでは、応答のストリーミングがサポートされています。ストリーミングを有効にするために API 要求で stream が true に設定されている場合、トークンメトリックが推定されます。

例

次の例では、LLM トークン数メトリックを API ID と共にカスタムディメンションとして Application Insights に送信します。

<policies>
  <inbound>
      <llm-emit-token-metric
            namespace="MyLLM">   
            <dimension name="API ID" />
        </llm-emit-token-metric> 
  </inbound>
  <outbound>
  </outbound>
</policies>

ポリシーに対する処理の詳細については、次のトピックを参照してください。

チュートリアル:API を変換および保護する
ポリシーステートメントとその設定の一覧に関するポリシーリファレンス
ポリシー式
ポリシーの設定または編集
ポリシー構成を再利用する
ポリシースニペットのリポジトリ
Azure API Management ポリシーツールキット
Azure で Microsoft Copilot を使用してポリシーを作成する

次の方法で共有

大規模言語モデルトークンを使用するためのメトリックを送信する

サポートされているモデル

カスタムメトリックの制限

前提条件

ポリシーステートメント

属性

要素

dimension の属性

値なしで使用できる既定のディメンション名

使用方法

使用上の注意

例

フィードバック

その他のリソース

次の方法で共有

大規模言語モデル トークンを使用するためのメトリックを送信する

サポートされているモデル

カスタム メトリックの制限

前提条件

ポリシー ステートメント

属性

要素

dimension の属性

値なしで使用できる既定のディメンション名

使用方法

使用上の注意

例

関連ポリシー

関連するコンテンツ

フィードバック

その他のリソース

大規模言語モデルトークンを使用するためのメトリックを送信する

カスタムメトリックの制限

ポリシーステートメント