次の方法で共有


観察された人物のおすすめの衣服を有効にする

Azure AI Video Indexer の高度なビデオ設定を使用してビデオのインデックスを作成すると、観察された人物の特徴化した衣服を表示できます。 この分析情報では、ビデオ内で重要なユーザーが目立つように強調され、人物の座標、タイムスタンプ、撮影フレームなど、はっきりと見える瞬間を提供します。 この分析情報により、ビデオ内の特定の時間に合わせて関連する衣料品広告が表示される、コンテキストに応じた高品質なビデオ内広告が可能になります。

この記事では、おすすめの衣服の分析情報を表示する方法と、おすすめの衣服の画像がどのようにランク付けされるかについて説明します。

紹介ビデオを表示する

おすすめの服の分析情報を表示および使用する方法について説明した次の短いビデオを表示できます。

おすすめの衣服の分析情報は、ファイルにインデックスを付けるときに、[詳細オプション] ->[詳細ビデオ] または [詳細ビデオ + オーディオ] プリセット ([動画 + オーディオのインデックス作成] の下) を選択すると使用できます。 標準のインデックス作成には、この分析情報は含まれません。

このスクリーンショットは、ビデオのインデックス作成オプションを表します。

おすすめの衣服の画像は、ビデオの重要な瞬間、人物が登場する時間、テキストベースの感情、音声イベントなど、いくつかの要因に基づいてランク付けされます。 分析情報は、シーンごとの最高の順位が付けられたフレームを非公開にするため、ビデオ全体を通してシーンごとにコンテキスト広告を生成できます。 JSON ファイルは、ビデオ内のシーンのシーケンスによって順位付けされ、各シーンの評価が最も高いフレームが結果として得られます。

Note

おすすめの衣服の分析情報は成果物ファイルからのみ表示でき、その分析情報は Azure AI Video Indexer の Web サイトには表示されません。

  1. 右上隅で、成果物の zip ファイルのダウンローを選択します: [ダウンロード] ->[成果物 (ZIP)]
  2. featuredclothing.zip を開きます。

この .zip ファイルには次の 2 つのオブジェクトが含まれています。

  • featuredclothing.map.json - ファイルには、次のプロパティを持つ各おすすめの衣服のインスタンスが含まれています。

    • id – ランク付けインデックス("id": 1 は最も重要な衣服です)。
    • confidence – おすすめの衣服のスコア。
    • frameIndex – 衣服の最高のフレーム。
    • timestamp – frameIndex に対応します。
    • opBoundingBox – 人物の境界ボックス。
    • faceBoundingBox – 人物の顔の境界ボック (検出された場合)。
    • fileName – 衣服の最高のフレームが保存されている場所。
    • sceneID - そのシーンが表示されるシーン。

    "sceneID": 1 とおすすめの服の例。

    "instances": [
      	{
        		"confidence": 0.07,
    			"faceBoundingBox": {},
    			"fileName": "frame_100.jpg",
        		"frameIndex": 100,
        		"opBoundingBox": {
            			"x": 0.09062,
            			"y": 0.4,
    				"width": 0.11302,
            			"height": 0.59722
    				},
       			 "timestamp": "0:00:04",
        		"personName": "Observed Person #1",
        		"sceneId": 1
      	}
    
  • featuredclothing.frames.map – このフォルダーには、おすすめの衣服が表示された最高のフレームの画像が含まれています。これは featuredclothing.map.json 内の各インスタンスの fileName プロパティに対応します。

制限事項と前提

低品質または関連性の低い画像の誤検出の影響を回避または軽減するために、おすすめの衣服の制限に注意することが重要です。 

  • おすすめの衣服の事前条件は、服を着ている人物が、観察された人々の分析情報で見つかるということです。
  • おすすめの衣服を着ている人物の顔が検出されなかった場合、結果には顔の境界ボックスは含まれません。
  • ビデオの人物が複数の服を着ている場合、アルゴリズムはその最高の服を単一のおすすめの衣服の画像として選択します。
  • ポーズをとったときに、トラックは、最も頻繁に前面に表示される観察された人を処理するために最適化されます。
  • 誤検出は、人々が重なっているときに発生する可能性があります。
  • ぼやけた人々を含むフレームは、品質の低い結果になりやすくなります。

詳細については、観察される人々の制限に関するページを参照してください。