編集

次の方法で共有


Azure でのイメージの分類

Azure Blob Storage
Azure Computer Vision
Azure Cosmos DB
Azure Event Grid
Azure Functions

ソリューションのアイデア

この記事ではソリューションのアイデアについて説明します。 クラウド アーキテクトはこのガイダンスを使用すると、このアーキテクチャの一般的な実装の主要コンポーネントを視覚化しやすくなります。 ワークロードの特定の要件に適合する、適切に設計されたソリューションを設計するための出発点として、この記事を使用してください。

Computer Vision API、Azure 関数 などの Azure サービスを使用すると、企業はサーバーを個別に管理する必要がなくなり、コストを削減できるほか、既に Microsoft で開発済みの、Azure AI サービス でのイメージ処理に関する専門知識を利用できます。 このソリューション アイデアは、特に画像処理のユース ケースに対応しています。 別の AI ニーズがある場合は、一連の Azure AI サービス について検討してください。

Architecture

画像分類タスクに使用されるアーキテクチャの図。

このソリューションのアイデアの Visio ファイルをダウンロードします。

データフロー

このシナリオでは、Web またはモバイル アプリケーションのバックエンド コンポーネントに対応できます。 シナリオのデータ フローは次のとおりです。

  1. BLOB ストレージに新しいファイル (画像のアップロード) を追加すると、Azure Event Gridでイベントがトリガーされます。 アップロード プロセスは、Web またはモバイル アプリケーションを介して調整できます。 または、画像を Azure BLOB ストレージに個別にアップロードすることもできます。
  2. Event Grid により、Azure 関数 をトリガーする通知が送信されます。
  3. Azure Functions は Azure AI Vision API を呼び出して、新しくアップロードされた画像を分析します。 Azure AI Vision は、Azure Functions によって解析された BLOB URL を介して画像にアクセスします。
  4. Azure Functions は、Azure Cosmos DB で AI Vision API の応答を保持します。 この応答には、イメージ メタデータと共に分析の結果も含まれます。
  5. 結果を、Web またはモバイル フロントエンドで使用したり、そこに反映したりできます。 この方法では、アップロードされたイメージではなく、分類の結果が取得されることに注意してください。

コンポーネント

  • Azure AI Vision は、Azure AI サービス スイートに含まれ、個々の画像に関する情報の取得に使用されます。
  • Azure Functions には、Web アプリケーション向けのバックエンド API が用意されています。 また、アップロードされたイメージのイベント処理もこのプラットフォームで行います。
  • Azure Event Grid は、新しいイメージが Blob Storage にアップロードされたときに、イベントをトリガーします。 その後、イメージは Azure 関数で処理されます。
  • Azure Blob Storage には、Web アプリケーションにアップロードされたすべてのイメージ ファイルと、Web アプリケーションによって使用される任意の静的ファイルが格納されます。
  • Azure Cosmos DB には、Computer Vision API からの処理結果を含め、アップロードされた各イメージに関するメタデータが格納されます。

代替

  • Azure OpenAI GPT-4 Turbo with Vision (プレビュー)。 GPT-4 Turbo with Vision は、画像を分析し、それらに関する質問に回答できるマルチモーダル モデルです。
  • Custom Vision Service。 Computer Vision API は、一連の 分類ベースのカテゴリを返します。 Computer Vision API によって返されていない情報を処理する必要がある場合は、Custom Vision Service を検討してください。これにより、カスタム イメージ分類子を構築できます。
  • Azure AI 検索 (旧称 Azure Search)。 特定の条件を満たす画像を検索するために、ご自身のユース ケースでメタデータにクエリを実行する必要がある場合は、Azure AI 検索を検討してください。 Azure AI 検索 は、このワークフローをシームレスに統合します。
  • Logic Apps。 Blob に追加されたファイルにリアルタイムに応答する必要がない場合は、Logic Apps の使用を検討できます。 ファイルが追加されたかどうかを確認できるロジック アプリは、 繰り返しトリガーまたはスライディング ウィンドウ トリガーによって開始される可能性があります。
  • ドキュメントに画像が埋め込まれている場合は、Azure AI Document Intelligence を使用して、それらの画像を特定します。 その情報を使用して、埋め込み画像を抽出し、さらにコンピューター ビジョン タスクを実行できます。 Document Intelligence を使用して、埋め込み画像に関するデータを収集します。Computer Vision API を介して受信した画像の他のメタデータと共に格納できる、ページ番号やキャプション テキストなどです。

シナリオの詳細

このシナリオは、イメージを処理する必要があるビジネスに関連があります。

応用の可能性としては、ファッション Web サイトのイメージの分類、保険金請求のテキストおよびイメージの分析、ゲームのスクリーンショットからの利用統計情報の把握などが挙げられます。 従来、企業では、機械学習モデルで専門知識を開発したうえで、そのモデルをトレーニングし、最終的にカスタム プロセスによってイメージを実行し、イメージからデータを取得していました。

考えられるユース ケース

このソリューションは、小売、ゲーム、金融、保険業界に最適です。 その他の関連するユース ケース:

  • ファッション Web サイトの画像の分類。 画像分類は、販売用にプラットフォーム上の製品の画像をアップロードする際に販売者が使用することができます。 その後、結果の関連する手動でのタグ付けを自動化できます。 顧客は、製品の視覚的な印象を検索することもできます。

  • ゲームのスクリーンショットの利用統計情報の分類。 スクリーンショットからのビデオ ゲームの分類は、コンピューター ビジョンと組み合わされて、ソーシャル メディアで意義のある問題に発展しています。 たとえば、Twitch ストリーミング配信者が連続して異なるゲームを再生する場合、ストリーム情報の手動更新を省くことがあります。 ストリーム情報を更新しないと、ユーザー検索でストリームが誤って分類され、コンテンツ作成者とストリーミング プラットフォームの両方で潜在的な視聴が失われる可能性があります。 新しいゲームを導入する際、カスタム モデル ルートが、それらのゲームから新しいイメージを検出する機能を導入するのに役立つ場合があります。

  • 保険金請求のイメージの分類。 画像分類は、要求処理や引受の時間とコストを削減するのに役立ちます。 これは、自然災害の被害や車両の損傷を分析し、住宅や商業の資産を識別するのに役立ちます。

次のステップ

製品ドキュメント

ガイド付きラーニング パスについては、以下を参照してください。

画像とテキストの処理での AI エンリッチメントの使用