Azure AI モデル推論サービスとは
Azure AI モデル推論サービスを使用すると、Azure AI モデル カタログで使用できる最も強力なモデルにアクセスできます。 このようなモデルは、OpenAI、Microsoft、Meta、Mistral、Cohere、G42、AI21 Labs などの業界の主要なモデル プロバイダーから提供されており、ソフトウェア ソリューションと統合して、コンテンツ生成、要約、画像の解釈、セマンティック検索、コード生成などの幅広いタスクを実行できます。
Azure AI モデル推論サービスには、モデルをインフラストラクチャ上でホストせずに API として使用する方法が用意されています。 モデルは Microsoft が管理するインフラストラクチャでホストされ、モデル プロバイダーのモデルへの API ベースのアクセスが可能になります。 API ベースのアクセスにより、モデルにアクセスするコストが大幅に削減され、プロビジョニング エクスペリエンスがシンプルになります。
モデル
OpenAI、Microsoft、Meta、Mistral、Cohere、G42、AI21 Labs など、業界の主要なモデル プロバイダーにアクセスできます。 モデル プロバイダーはライセンス条項を定義し、モデルの利用価格を設定します。 次の一覧は、使用できるすべてのモデルを示しています。
モデル プロバイダー | モデル |
---|---|
AI21 Labs | - AI21-Jamba-1.5-Mini - AI21-Jamba-1.5-Large |
Azure OpenAI | - o1-preview (Request Access) - o1-mini (Request Access) - gpt-4o-mini - gpt-4o - text-embedding-3-small - text-embedding-3-large |
Cohere | - Cohere-command-r-plus-08-2024 - Cohere-command-r-08-2024 - Cohere-embed-v3-multilingual - Cohere-embed-v3-english - Cohere-command-r-plus - Cohere-command-r |
Meta AI | - Meta-Llama-3-8B-Instruct - Meta-Llama-3-70B-Instruct - Meta-Llama-3.1-8B-Instruct - Meta-Llama-3.1-70B-Instruct - Meta-Llama-3.1-405B-Instruct - Llama-3.2-11B-Vision-Instruct - Llama-3.2-90B-Vision-Instruct |
Mistral AI | - Mistral-Small - Mistral-Nemo - Mistral-large - Mistral-large-2407 |
Microsoft | - Phi-3-mini-4k-instruct - Phi-3-medium-4k-instruct - Phi-3-mini-128k-instruct - Phi-3-medium-128k-instruct - Phi-3-small-8k-instruct - Phi-3-small-128k-instruct - Phi-3.5-vision-instruct - Phi-3.5-mini-instruct - Phi-3.5-MoE-instruct |
作成されたリソースで、推論に使用できるモデルを決定し、構成することができます。 特定のモデルが構成されたら、要求でそのモデル名またはデプロイ名を指定することで、そこから予測を生成できます。 これを使用するためにコードをさらに変更する必要はありません。
Azure AI モデル推論リソースにモデルを追加して使用する方法については、Azure AI モデル推論で Azure AI モデルにモデルを追加して構成する方法に関する記事を参照してください。
価格
Microsoft 以外のプロバイダーによって提供されるモデル (Meta AI や Mistral のモデルなど) は、Azure Marketplace を通じて請求されます。 このようなモデルの場合は、「Microsoft コマーシャル マーケットプレースの使用条件」に従って、特定のモデル オファリングをサブスクライブする必要があります。 ユーザーはモデルの使用に関するライセンス条項に同意します。 使用する価格情報はデプロイ時に提供されます。
Microsoft が提供するモデル (Phi-3 モデルや Azure OpenAI モデルなど) にはこの要件がなく、ファースト パーティ従量課金サービスとして Azure メーターを介して課金されます。 製品使用条件に記載されているように、ファースト パーティ従量課金サービスは Azure メーターを使用して購入しますが、Azure サービス使用条件の対象ではありません。