Azure AI Video Indexer リリース ノート
このページを見直して、最新の更新プログラムを確認してください。
常に最新の Azure AI Video Indexer 開発情報を把握していただけるよう、この記事では以下に関する情報を提供します。
- 最新のリリース
- 既知の問題
- バグの修正
- 非推奨の機能
2024 年 11 月
マルチモーダル ビデオ要約 - クラウドとエッジ
キーフレームをオーディオやビデオの分析情報と共に分析することで、テキストビデオの要約を強化するマルチモーダルビデオ要約を導入することに興奮しています。 この機能は、Azure OpenAI を利用したクラウドと、ARC で有効になっている VI の一部として Edge の両方で利用できます。 これは、パフォーマンスを向上させるために GPU で実行するように構成できる、最新の Phi3.5 ビジュアル モデルを利用します。
拡張プロンプト コンテンツ API
Prompt Content API とも呼ばれる Video-to-Text API では、Llama2、Phi3、Phi3.5、GPT-4O、GPT-4O Mini など、より多くのモデルがサポートされるようになりました。 この機能強化により、ビデオ コンテンツをテキストに変換する際の柔軟性が向上し、Azure Video Indexer を使用する際の機会が増えます。 Azure Video Indexer から、モデル名を選択してプロンプト スタイルを調整することでカスタマイズできるプロンプト形式で情報を収集できます。 "要約" スタイルは、ビデオの概要、ビデオの名前付け、メイン イベントの説明などのタスクに最適ですが、"完全" スタイルは Q&A、RAG、検索のユース ケースに適しています。 この API の詳細については、「 Azure Video Indexer 操作とプロンプト コンテンツを参照してください。
2024 年 10 月
新しいサンプル コード
Logic Apps 使用して Azure AI Video Indexer データを Azure Data Explorer にエクスポートするための新しいサンプル コード があります。
2024 年 8 月
テキスト ビデオ要約のセキュリティ強化
テキストビデオ要約には脱獄攻撃のリスクを防ぐためのサポートが含まれるようになりました。 この新しいセキュリティ フィルターは、言語モデルベースのテキスト ビデオ要約の恩恵を受けるために、AOAI に追加する必要があります。 詳細については、「 Azure OpenAI を使用したテキスト ビデオの概要を参照してください。
エッジ デバイスでのテキスト ビデオの概要
ブログ投稿を公開しました Azure AI Video Indexer & Phi-3 で Edge のテキスト ビデオの概要を紹介しました: Better Together ストーリー
2024 年 7 月
Arc による VI 有効化に関するテキスト要約
最新の Phi 3 モデルを使用して、Arc 拡張機能で有効になっている VI でテキスト要約機能を使用できるようになりました。 クラウドと同じ機能の恩恵を受けることができます。これには、いくつかの設定 (正式、カジュアル、ショート、ロング) を使用した概要のカスタマイズが含まれます。
言語識別の改善
- 離職時間と単一言語識別の品質が向上しました。
- ファイルに複数の言語がある場合 (1 つの言語識別を要求した場合):
- 最も優先度の高い言語で、最も長い期間出現した言語が返されます。
- 成果物には、元のビデオの音声によって識別されたすべての言語が含まれています。
- トランスクリプトには、最も優先度の高い言語の行のみが含まれており、異なる言語を含む行は除外されます。
プレーヤーとアクセシビリティの向上
Web サイト プレーヤーは、Shaka ベースの最新バージョンに更新されました。 プレイヤーもウィジェットに含まれています。
アクセシビリティの改善が Web サイトに実装されました。
2024 年 6 月
コード サンプル
- Azure Open AI で Azure AI Video Indexer を使用すると、学習者やトレーナーにとって関連性の高いビデオ コンテンツを簡単に見つけられるようになります。 Azure AI Video Indexer を使用したトレーニング検索エクスペリエンスの概要ブログ記事とソース コードを参照してください。
- Azure LogicApps を使用して、ビデオで検出された自動車を分類します。 このサンプルでは、Video Indexer の Bring Your Own 機能を使用してオブジェクトを検出し、Azure OpenAI の GPT-4 を使用して分類を強化しています。 YouTube デモとサンプル コードを参照してください。
ファイル期間の制限の引き上げ
すべてのプリセットで、最大 6 時間 (以前の制限は 4 時間) のファイルのインデックス作成がサポートされるようになりました。Basic Audio プリセットでは、最大 12 時間のファイルのインデックス作成がサポートされるようになりました。
2024 年 5 月
テキスト要約
Azure AI Video Indexer では、ビデオ全体を視聴しなくても、ビデオの概要が簡単に提供されるようになりました。 長いビデオを消化し、短い形式で要点を与えることで、時間を節約するように設計されています。 これは、簡潔で消化しやすい要約に長いビデオを蒸留します。
要約アルゴリズムを使用して、ビデオに最も関連性の高い分析情報を特定します。 テーマ全体に対する重要度と関連性に基づいて分析情報をスコア付けする必要があります。 ユーザーフレンドリーなインターフェイスを使用すると、ビデオを入力し、必要な概要の種類をカスタマイズできます。
概要をカスタマイズするには、[短い]、[長い]、[正式]、[カジュアル] を選択し、特定のモデルのデプロイを指定します。
テキスト要約の詳細については、「 テキスト要約の概要を参照してください。
Azure OpenAI の統合
Azure AI Video Indexer では、Azure OpenAI との統合が提供されるようになりました。 新しい Azure Video Indexer アカウントを作成するときに Azure OpenAI リソースを接続するか、既存の Azure Video Indexer アカウントに追加できます。 VI を Azure OpenAI に接続する場合は、API とポータルから入手できるテキスト要約機能を使用できます。
Azure OpenAI を VI アカウントに接続する方法の詳細については、「 Azure OpenAI 接続を使用して Azure AI Video Indexer アカウントを作成または更新するを参照してください。
プロンプト コンテンツ API の拡張
Azure AI Video Indexer の Prompt Content API で、Phi 2、Llama、GPT 4V というより多くの言語モデルがサポートされるようになりました。 GPT 4V で Prompt Content API を使用すると、他の分析情報と共に言語モデルで分析できるキーフレームが出力されます。
2024 年 4 月
モデルを除外する
VI Web サイトと API の両方を使用してインデックスを作成するときに、モデルを除外できるようになりました。 インデックス作成にビデオをアップロードするときは、 [Advanced settings>Indexing presets]\(プリセットのインデックス作成\) を選択し インデックス作成の結果から除外する AI モデルを選択します。 これにより、関心のある分析情報のみを含む、より効率的なインデックス作成と VI 結果を実現できます。
新しい可用性リージョン
Azure AI Video Indexer は、ドイツ中西部リージョンで利用できるようになりました。
2024 年 2 月
AMS レス アカウントと移行ガイダンス
- すべての新しいVIアカウントのビデオパッケージ、ストリーミング、エンコードはVIによって実行され、AMSベースのVIアカウントを作成できなくなります。 新しいアカウント作成ガイド 参照してください。
- VI エンコード/パッケージ化は、無料ストリーミングで 1 分あたり 1 セントの定額で課金されます。
- VI アカウントを AMS ベースから新しい AMS レス アカウントの種類に更新できます。
- AMS VIアセットをVIで再処理して移行することを選択できるため、ビデオや分析情報に引き続きアクセスできます。 移行は 3 月下旬に開始されます。
- Video Indexer Web アプリとウィジェットは、高パフォーマンスで Azure メディア プレーヤーを使用しなくなった新しいメディア プレーヤーを使用します。
次のドキュメントでは、アカウントと資産の移行プロセスについて説明します。
- AMS の提供終了に関する Preparing: VI の移行と更新に関するガイドを参照してください。
- Azure AI Video Indexer アカウントの更新と資産の移行を参照してください。
- 新しい API バージョンを参照してください。
TLS1.3 のサポート
トランスポート層セキュリティ (TLS) プロトコルの最新バージョンである TLS 1.3 がサポートされています。これは、データを暗号化して、2 つのエンドポイント間のセキュリティで保護された通信チャネルを提供します。
スウェーデン中部と米国西部にデプロイされた Azure AI Video Indexer3
スウェーデン中部リージョンと米国西部 3 リージョンで Azure AI Video Indexer 有料アカウントを作成できるようになりました。
2024 年 1 月
新しい LLM プロンプト コンテンツ
これで、ビデオの分析情報を大規模言語モデル (LLM) に接続して、要約や質問の回答などのタスクを実行できるようになりました。 この API は、ビデオ分析情報を LLM で使用するための "プロンプト対応" テキスト形式に変換します。 詳細については、「
2023 年 12 月
新しいプリセット オプション - 基本的なビデオ
Video Indexer では、新しいインデックス作成プリセット オプションである Basic Video が追加されました。 Arc 拡張機能で有効になっている VI でも使用できます。 OCR、物体検出、ビジュアル ラベルなど、多くの有用な AI 分析情報を含む低コストのインデックス作成オプションです。 Basic Video を使用して、Basic Audio (Basic Audio and Video) または単独 (Basic Video のみ) と共に分析情報を生成できます。 インデックス作成オプションの詳細については、 Indexing 構成ガイドを参照してください。
フレームの取得 API
FramesSasUrls
要求を行うことで、選択したビデオ セクションのインデックス付きビデオからフレームを抽出できるようになりました。 詳細については、「 FrameSelection」を参照してください。
Bring Your Own Model (プレビュー)
- カスタム分析情報の UI サポートを追加しました。
- カスタム分析情報の検索サポートが追加されました。
詳細については、「 独自の AI モデルの作成」を参照してください。
Azure AI Video Indexer Web サイトと API でオブジェクトで検索する
検索機能を使用して、Azure AI Video Indexer Web サイトで、または search 要求を使用して、特定のオブジェクト (自動車、オートバイなど) を含むビデオを検索できるようになりました。
2023 年 11 月
Video Indexer では、11 月に次のものがリリースされました。
Arc で有効になっている Azure AI Video Indexer (プレビュー)
Video Indexer は、Kubernetes クラスターでオンプレミスでホストすることで、ハイブリッド シナリオに使用できます。 詳細については、「 Azure AI Video Indexer enabled by Arc の概要を参照してください。 tutorialに従って拡張機能を試すこともできます。
Bring Your Own Model (プレビュー)
独自のカスタマイズされた AI モデルを使用し、Video Indexer モデルとデータを統合できます。 詳細については、「 独自の AI モデルの作成」を参照してください。
ビデオあたりのカスタム タグとフリー テキスト (プレビュー)
Video Indexer アカウント内の任意のビデオに、カスタム タグとフリー テキストをビデオ メタデータとして追加できます。 これにより、自分とビジネスに関連する情報を使用してビデオを分類し、注釈を付けることができます。 たとえば、"製品デモ"、"顧客の声"、"内部トレーニング" などのタグや、"このビデオは新機能 X の使用方法を示しています" や "このビデオは Y の年次会議で記録されました" などのフリー テキストを追加できます。 ビデオのインデックスが作成されたら、ビデオの下の領域に追加できます。
カスタム タグとフリー テキストに基づく検索 (プレビュー)
カスタム タグとフリー テキストに基づいてビデオを検索できます。 これにより、条件に一致するビデオをより簡単かつ迅速に見つけることができます。 サポートされているすべての言語のカスタム タグとフリー テキストに基づいて検索でき、キーワード、顔、ラベル、感情などの他の検索フィルターと組み合わせることができます。高度な検索構文を使用して、より複雑なクエリを実行することもできます。 たとえば、タグ "product demo" とフリー テキスト "feature X" を持つビデオを検索できます。
カスタマイズされた人物モデルに多数の機能強化が追加され、全体的なエクスペリエンスと精度が向上しました。 People モデルは、ビデオ内の特定のユーザーを認識するように独自のモデルをトレーニングできるゲート AI モデルです。 新しい追加は次のとおりです。
人物モデルの品質に関する表示 (プレビュー)
カスタマイズした People モデルの品質 (貧しい、公正、良い) を示すことができます。 品質は、ラベル付けに使用する画像の数が多いほど、ユーザーを正しく識別する確率が高くなります。 たとえば、24 個のラベル付き画像を持つ人物を識別する確率は、2 つのラベル付き画像を持つ人物を識別する確率よりも高くなります。 カスタマイズした People モデル ページで、各ユーザーのラベル付けに使用される画像の数を確認できます。
カスタムユーザー モデルを既定として選択する (プレビュー)
カスタマイズした People モデルを VI アカウントのユーザー レベルで既定として選択できるようになりました。そのため、ビデオのアップロードごとにモデル名を選択し続ける必要はありません。 これにより、カスタマイズした People モデルで分析する必要があるビデオをアップロードする際の時間と労力が節約されます。
ビデオ内の不明なユーザーのグループ化 (プレビュー)
ビデオ内の不明なユーザーを、外観の類似性別にグループ化して表示できます。 これにより、不明なユーザーに簡単かつ迅速にラベルを付け、カスタマイズした People モデルの精度を向上させることができます。 カスタマイズ ページで不明なユーザーのグループ化を確認>ユーザーを選択し不明なユーザー タブに移動します。これは、たとえば、地元の有名人や地元の政治家にラベルを付けるのに役立ちます。
識別されたユーザー名の最大信頼度スコアを持つ検索結果 (プレビュー)
識別された人物の名前を検索し、その人物がビデオに表示されたときに、最大信頼度スコアを使用して取得できます。 これは、探索する最も関連性の高いビデオを決定するのに役立ちます。 たとえば、"John Smith" を検索し、カスタマイズした People モデルによって John Smith が認識されるビデオと、各ビデオの信頼度スコアを取得できます。
インデックス作成のアップロードの重複を回避する
場合によっては、意図せずに同じインデックス作成ジョブを複数回送信することがあります。 これを回避するために、新しい省略可能なクエリ パラメーターが追加 preventDuplicates
。 true
に設定すると、サービスはファイルのアップロードを拒否し、既にインデックスが作成されている場合は競合を返します。
アップロード URL MD5 重複チェックは、RFC 1864: Content-MD5 ヘッダー フィールドが存在する場合は、サーバー応答Content-md5 ヘッダーに依存します。これは、ストレージ プロバイダーによって一般的に使用されるためです。
同じビデオを繰り返しアップロードする場合は、パラメーターを false
に設定できます。
2023 年 10 月
新しい分析情報 - オブジェクト検出
Video Indexer は、標準ビデオ プリセットと高度なビデオ プリセットの両方に、新しい分析情報、物体検出を追加しました。 ビデオに表示されるさまざまなオブジェクトを識別して追跡するために使用できます。 詳細については、「 Azure AI Video Indexer オブジェクト検出の概要を参照してください。
2023 年 9 月
AMS の廃止に関連する変更事項
2024 年 6 月 30 日の Azure Media Services (AMS) の廃止に伴い、Video Indexer は関連項目の多くの廃止を発表しました。 これには、2024 年 6 月 30 日の Video Indexer クラシック アカウントの廃止、API の変更、アダプティブ ビットレートのサポート終了が含まれます。 詳細については、「Azure Media Service (AMS) の廃止に関連する変更」を参照してください。
2023 年 7 月
Azure AI Video Indexer API を使用して顔を編集する
Azure AI Video Indexer API を使用して顔を編集できるようになりました。 詳細については、「 Azure AI Video Indexer API を使用して顔を編集するを参照してください。
API 要求の制限の引き上げ
Video Indexer は、API 要求の制限を 1 分あたり 60 要求から 120 に引き上げました。
2023 年 6 月
Azure Media Services の提供終了が発表されました。
2023 年 5 月
API の更新
既存のクエリ ロジックに対する変更を要する可能性のある動作の変更が実施されます。 変更は、List API と Search API で行われます。次の表で、動作の詳しい変更点をご確認ください。 新しい API を利用するには、コードの更新が必要になる場合があります。
API | [現在] | 新しい | 更新内容 |
---|---|---|---|
ビデオを一覧表示する | • 'IsBase' ブール値パラメーターに従って、すべてのビデオ/プロジェクトを一覧表示します。 'IsBase' が定義されていない場合は、両方を一覧表示します。 • すべての状態 (進行中/処理完了/失敗) のビデオを返します。 |
• List Videos API は、すべての状態の (ページングを使用した) ビデオのみを返します。 • List Projects API は、(ページングを使用した) プロジェクトのみを返します。 |
• List videos API が、2つの新しい API のList Videos と List Projects に分割されました。 • 'IsBase' パラメーターが意味を持たなくなりました。 |
ビデオを検索する | • 'IsBase' ブール値パラメーターに従って、すべてのビデオ/プロジェクトを検索します。 'IsBase' が定義されていない場合は、両方を検索します。 • すべての状態 (進行中/処理完了/失敗) のビデオを検索します。 |
処理完了になっているビデオのみを検索します。 | • Search Videos API はビデオのみを検索し、プロジェクトは検索しません。 • 'IsBase' パラメーターが意味を持たなくなりました。 • Search Videos API は、処理完了になっているビデオのみを検索します (失敗/進行中のビデオは検索しません)。 |
HTTP/2 のサポート
Data Plane API の HTTP/2 サポートを追加しました。 HTTP/2 には、下位互換性のために引き続きサポートされる HTTP/1.1 を上回る利点がいくつかあります。 HTTP/2 の主なの利点の 1 つとして、HTTP/1.1 よりもパフォーマンスと信頼性が向上し、システム リソースの要件が軽減しています。 この変更により、Video Indexer ポータル と Data Plane API の両方で HTTP/2 がサポートされるようになりました。 この変更を活用できるように、コードを更新することをお勧めします。
トピックの分析情報の機能強化
IPTC オントロジの 5 つのレベルがすべてサポートされるようになりました。
2023 年 4 月
Resource Health のサポート
Azure AI Video Indexer が Azure Resource Health と統合されたため、Azure AI Video Indexer の各リソースの正常性と可用性を確認できるようになりました。 Azure Resource Health は問題の診断と解決にも役立ち、リソースが影響を受けるたびに通知されるようにアラートを設定できます。 詳細については、「Azure Resource Health の概要」を参照してください。
アニメーション文字認識モデルが廃止されました
アニメーション文字認識モデルが、2023 年 3 月 1 日に廃止されました。 関連する問題については、Azure portal 経由でサポート チケットを開いてください。
機密性の高い AI モデルの除外
Microsoft の責任ある AI の原則に従い、Azure AI Video Indexer でメディア ファイルのインデックス作成時に特定の AI モデルを除外できるようになりました。 機密性の高い AI モデルの一覧には、顔検出、観察対象人物、感情、ラベルの識別が含まれます。
現在この機能は、API を介して使用できます。また、Advanced プリセットを除くすべてのプリセットで使用できます。
観察された人の検出の改善
詳細については、「ユース ケース選択時の考慮事項と制限事項」を参照してください。
2023 年 3 月
ファイアウォールの背後にあるストレージのサポート
エンタープライズ セキュリティ ポリシーを強化または遵守するために、ストレージ アカウントをロックしてパブリック アクセスを無効にすることをお勧めします。 Video Indexer では、マネージド ID を使用した 信頼された Azure サービスの例外を使用して、非パブリックのアクセス可能なストレージ アカウントにアクセスできるようになりました。 設定方法の詳細については、攻略ガイドを参照してください。
新しいカスタム音声と発音トレーニング
Azure AI Video Indexer に、新しいカスタム音声モデル エクスペリエンスが追加されました。 このエクスペリエンスには、カスタム発音データセットを使用して、誤って発音された単語、フレーズ、または名前の認識を改善する機能が含まれています。 カスタム モデルを使用すると、業界固有の用語を使用して、コンテンツの文字起こしの品質を高めることができます。 詳細については、「音声モデルのカスタマイズの概要」を参照してください。
観察対象人物の品質の向上
観察対象人物で、座っている人物がサポートされるようになりました。 これは、立っている人物や歩いている人物の既存のサポートに加えて追加されました。 この改善により、観察対象人物モデルの汎用性が向上し、幅広いユース ケースに対応可能になりました。 また、モデルの再識別とグループ化アルゴリズムが 50% 改善しました。 このモデルでは、複数のカメラ ビューで人物をより正確に追跡およびグループ化できるようになりました。
観察対象人物のインデックス作成時間の最適化
観察対象人物モデルのメモリ使用量を最適化した結果、高度なビデオ分析プリセットを使用した場合のインデックス作成時間が 60% 短縮しました。 ビデオ映像をより効率的に処理し、結果をより迅速に取得できるようになりました。
2023 年 2 月
価格
2023 年 1 月 1 日に、Advanced プリセット用の Advanced Audio and Video SKU が導入されました。 これは、Azure Billing ステートメントで独自のメーターを使用して、各プリセット (Basic、Standard、Advanced) の使用を報告するために行われました。 Azure のコスト分析レポートでも確認できます。
2 月 1 日より、Basic Audio Analysis、Audio Analysis、Video Analysis の各 SKU の価格が 40% 引き下げられます。 Microsoft はお客様からのフィードバックと市場動向を考慮し、お客様の利益となるこの度の変更を実施しました。 価格を下げ、新しい Advanced SKU を導入することで、コストと機能のバランスを取るための競争力のある価格とより多くのオプションを顧客に提供しています。 さらに、AI 機能の改善と追加を続ける中で、お客様は、新しい操作またはインデックス再作成操作を実行するときに、これらのコスト削減を利用できるようになります。
この変更は自動的に実装されます。既に Azure の割引を受けているお客様は、新しい価格に加えて割引が引き続き適用されます。
料金の | Basic の音声分析 | Standard Audio Analysis | Advanced Audio Analysis | Standard Video Analysis | Advanced Video Analysis |
---|---|---|---|---|---|
入力 1 分あたり | $0.0126 | $0.024 | $0.04 | $0.09 | $0.15 |
ネットワーク サービス タグ
Video Indexer では、Video Indexer IP からネットワークへのネットワーク トラフィックを許可するネットワーク セキュリティ タグの使用がサポートされています。 1 月 22 日より、ネットワーク セキュリティ サービス タグの名称が AzureVideoAnalyzerForMedia
から VideoIndexer
に変更されました。 この変更に伴い、デプロイ スクリプトや既存の構成を更新する必要があります。 詳細については、ネットワーク セキュリティに関するドキュメント を参照してください。
2023 年 1 月
通知エクスペリエンス
Azure AI Video Indexer Web サイトに通知パネルが追加され、サービスに影響を与えるイベントや新しいリリースなど、製品の重要な最新情報を確認できるようになりました。
テキスト形式のロゴの検出
テキスト形式のロゴの検出を使用すると、ビデオ内で検出するテキスト ロゴをカスタマイズできます。 詳細については、「テキスト ロゴを検出する」を参照してください。
ディレクトリの切り替え
サポートされている言語
- 新しい言語がサポートされました (アイルランド語、ブルガリア語、カタロニア語、ギリシャ語、エストニア語、クロアチア語、ラトビア語、ルーマニア語、スロバキア語、スロベニア語、テルグ語、マラヤーラム語、カンナダ語、アイスランド語、アルメニア語、グジャラート語、マレー語、タミル語)。
- API を使用してすべてのサポート対象言語を取得してください (サポートされている言語の取得)。
詳細については、サポートされる言語に関する記事を参照してください。
顔のグループ化
UI と insights.json における低品質の顔検出の発生回数が大幅に削減されました。 グループ化アルゴリズムの改善により、品質と使いやすさが向上しました。
2022 年 11 月
スピーカーの名前を Azure AI Video Indexer Web サイトから編集できるようになりました
Azure AI Video Indexer Web サイトを使用して、新しいスピーカーを追加したり、特定のスピーカーの名前を変更したり、特定のトランスクリプト行に割り当てられたスピーカーを変更したりできるようになりました。 [タイムライン] ウィンドウからスピーカーを編集する方法の詳細については、「Azure AI Video Indexer Web サイトでスピーカーを編集する」を参照してください。
Azure AI Video Indexer の upload video index API からも同じ機能を利用できます。
2022 年 10 月
新しい組み込みロール: Video Indexer 制限付き閲覧者
アクセスが制限されている Video Indexer 制限付き閲覧者ロールは、Azure AI Video Indexer Web サイトのユーザーを対象にしています。 このロールの許可されるアクションは、Azure AI Video Indexer Web サイトのエクスペリエンスに関連しています。
詳細については、「Video Indexer 制限付き閲覧者ロールを使用してアクセスを管理する」を参照してください。
スレート検出の分析情報 (プレビュー)
高度なインデックス作成オプションを使用してビデオのインデックスを作成すると、次のスレート検出 (映画の制作後) の分析情報が自動的に識別されます。
- メタデータ抽出によるカチンコの検出。
- カラー バーを含むデジタル パターン検出。
- シーン マッチングを含むテキストレス スレート検出。
詳細については、スレート検出に関する記事を参照してください。
STT、翻訳、検索に対する新しいソース言語のサポート
STT (音声テキスト変換)、翻訳、および検索のソース言語としてウクライナ語とベトナム語がサポートされるようになりました。 これは、 Azure AI Video Indexer Web サイト、ウィジェット、API で、これらの言語に対しても文字起こし、翻訳、検索機能がサポートされていることを意味します。
詳細については、サポートされる言語に関する記事を参照してください。
API を使用して文字起こしで話者の名前を編集する
Azure AI Video Indexer API を使用して、文字起こしで話者の名前を編集できるようになりました。
信頼度スコア付きの単語レベルの時間注釈
信頼度スコア付きの単語レベルの時間注釈がサポートされるようになりました。
注釈とは、オーディオ ファイルの文字起こしであれ元のテキスト ファイルであれ、既存のテキストに追加される任意の種類の追加情報のことです。
詳細については、「単語レベルの文字起こし情報を調べる」を参照してください。
インデックス作成ログを有効にする Azure Monitor 統合
以下で説明する新しいログのセットを使用すると、インデックス作成パイプラインをより適切に監視できます。
Azure AI Video Indexer でインデックス作成イベントの診断設定がサポートされるようになりました。 診断設定を使用して、Azure Log Analytics、Storage、Event Hubs、またはサード パーティのソリューションに、アップロードの監視ログとメディア ファイルのインデックス再作成をエクスポートできるようになりました。
Azure AI Video Indexer API を使用した LID および MLID でサポートされる言語の拡張
Azure AI Video Indexer API を使用して LID (言語識別) と MLID (多言語識別) でサポートされる言語を拡張しました。
API では次の言語がサポートされています。アラビア語 (アラブ首長国連邦)、アラビア語 (現代標準)、アラビア語 (エジプト)、アラビア語 (イラク)、アラビア語 (ヨルダン)、アラビア語 (クウェート)、アラビア語 (オマーン)、アラビア語 (カタール)、アラビア語 (カタール)、アラビア語 (サウジアラビア)、アラビア語 (シリア・アラブ共和国)、チェコ語、デンマーク語、ドイツ語、英語 (オーストラリア)、英語 (英国)、英語 (米国)、スペイン語、スペイン語 (メキシコ)、フィンランド語、フランス語 (カナダ)、フランス語、ヘブライ語、ヒンディー語、イタリア語、日本語、韓国語、ノルウェー語、オランダ語、ポーランド語、ポルトガル語、ポルトガル語 (ポルトガル)、ロシア語、スウェーデン語、タイ語、トルコ語、ウクライナ語、ベトナム語、中国語 (簡体字)、中国語 (広東語、繁体字)。
自動検出時に LID または MLID によって識別される言語の一覧を指定するには、upload a video API を呼び出し、上記でサポートされている言語から最大 10 の言語を含むように customLanguages
パラメーターを設定します。 customLanguages
で指定された言語は言語レベルで比較されるため、言語ごとに 1 つのロケールのみを含める必要があることに注意してください。
詳細については、サポートされる言語に関する記事を参照してください。
API を使用して人物モデルの信頼度レベルを構成する
Patch person model API を使用して、人物モデル内の顔認識の信頼度レベルを構成します。
クローズド キャプションでスピーカーを表示する
Azure AI Video Indexer メディア プレーヤーのクローズド キャプションでスピーカーを表示できるようになりました。 詳細については、「Azure AI Video Indexer Web サイトでクローズド キャプションを表示する」を参照してください。
パラメーターを使用して顔と人の境界ボックスを制御する
新しい boundingBoxes
URL パラメーターは、プレーヤーを埋め込むときに境界ボックスをオンまたはオフに設定するオプションを制御します。 詳細については、「ウィジェットの埋め込み」を参照してください。
アカウント設定から自動再生を制御する
Web アプリを使用して開いたときにメディア ファイルが自動再生されるかどうかを、ユーザー設定を使用して制御します。 [Azure AI Video Indexer Web サイト] ->歯車アイコン (右上隅) ->[ユーザー設定] ->[Auto-play media files] (メディア ファイルの自動再生) に移動します。
プレーヤー ビューからビデオ ID をコピーする
Azure AI Video Indexer Web サイトでビデオを選択すると、[Copy video ID] (ビデオ ID のコピー) が利用できます
ネイティブ Azure カラーの新しいダーク テーマ
Azure AI Video Indexer Web サイトで目的のテーマを選択します。 [歯車] アイコン (右上隅) ->[ユーザー設定] を選択します。
アカウント一覧を検索またはフィルター処理する
アカウント名またはリージョンを使用して、アカウント一覧を検索またはフィルター処理できます。 Azure AI Video Indexer Web サイトの右上隅にある [ユーザー アカウント] を選択します。
2022 年 9 月
ARM ベースのアカウントの一般提供
Azure Resource Management (ARM) ベースの paid (無制限) アカウントを使用すると、次の機能を使用できます。
- Azure のロールベースのアクセス制御 (RBAC)
- Azure Media Services と Azure AI Video Indexer アカウント間の通信をセキュリティで保護するマネージド ID、ネットワーク サービス タグ、およびアカウント (監査とインデックス作成ログ) を監視するための Azure Monitor とのネイティブ統合。
- ARM テンプレート、bicep、または Terraform を使用したデプロイのスケーリングと自動化。
- ARM ベース アカウント用のロジック アプリ コネクタの作成。
ARM ベースのアカウントを作成するには、アカウントの作成に関するページを参照してください。
2022 年 8 月
トピック推論モデルの更新
Azure AI Video Indexer トピック推論モデルが更新され、650 万件を超えるトピックが抽出されました (たとえば、新型コロナ ウイルスなどのトピックなど)。 最近のモデル更新の恩恵を受けるためには、ビデオ ファイルのインデックスを再作成する必要があります。
Azure Government でトピック推論モデルが利用可能
バージニア州とアリゾナ州のリージョンにおいて、Azure Government の Azure AI Video Indexer 有料アカウントでトピック推論モデルを活用できるようになりました。 このリリースでは、Azure グローバルと Azure Government の間の AI パリティが実施されています。 モデルの更新を利用するには、ビデオ ファイルのインデックスを再作成する必要があります。
Azure AI Video Indexer Web サイトでのセッションの長さが 30 日
Azure AI Video Indexer Web サイトのセッションの長さが 30 日に延長されました。 1 時間ごとに再度ログインしなくても、セッションを保持できます。
2021 年 7 月
特徴化した衣服の分析情報 (プレビュー)
特徴化した衣料の分析情報を使用すると、よりターゲットを絞った広告の配置が可能になります。
この分析情報では、ビデオ内で個人が着用する主要なアイテムに関する情報と、衣服が表示されるタイムスタンプが提供されます。 これにより、高品質の動画内コンテキスト広告が可能になります。関連する衣料品広告は、表示される動画内の特定の時間と一致します。
観察された人物の特徴化した衣服を表示するには、Azure AI Video Indexer の高度なビデオ設定を使用してビデオのインデックスを作成する必要があります。 特徴化した衣服の画像がどのようにランク付けされるのか、この分析情報を確認する方法の詳細については、特徴化した衣服に関する記事を参照してください。
2022 年 6 月
Azure portal で Video Indexer ブレードの機能強化を作成する
Azure AI Video Indexer では、同じリソースにシステム割り当てマネージド ID またはシステムおよびユーザー割り当てマネージド ID を使用した新しいリソースの作成がサポートされるようになりました。
Azure portal の [ID] タブを使用してプライマリ マネージド ID を変更することもできます。
著名人認識機能と顔識別機能の制限付きアクセス
責任ある AI に対する Microsoft の取り組みの一環として、Azure AI Video Indexer (識別機能と著名人認識機能) を設計およびリリースしています。 これらの機能は、個人や社会の権利を守り、人とコンピューターの透過的な相互作用を育むように設計されています。 したがって、Azure AI Video Indexer には、識別機能と著名人認識機能のアクセスと使用が制限されています。
識別機能と著名人認識機能は登録が必要であり、Microsoft が管理するお客様とパートナーのみが利用できます。 この機能を使用したいお客様は、受付フォームを申請して提出する必要があります。 詳細については、Azure AI Video Indexer の制限付きアクセスに関するページを参照してください。
また、お知らせのブログ記事および顔認識の投資と保護に関する記事を参照してください。
2022 年 5 月
トランスクリプトの改行
改行ロジックが改善され、トランスクリプトを文に分割しやすくなりました。 Azure AI Video Indexer Web サイトで、新しい行の追加や行のタイムスタンプの編集などの新しい編集機能が使用できるようになりました。 詳細については、「トランスクリプトの行の挿入または削除」を参照してください。
Azure Monitor の統合
Azure AI Video Indexer で監査イベントの診断設定がサポートされるようになりました。 監査イベントのログを、診断設定を使用して Azure Log Analytics、Azure Storage、Azure Event Hubs、またはサードパーティ ソリューションにエクスポートできるようになりました。
これが追加されたことで、データの分析、リソース操作の監視、イベントに対応する自動フローの作成を簡単に利用できます。 詳細については、Azure AI Video Indexer の監視に関する記事を参照してください。
ビデオの分析情報の改善
光学式文字認識 (OCR) が 60% 向上しました。 顔検出が 20% 向上しました。 さまざまなビデオでのラベルの精度が 30% 向上しました。 これらの機能強化はすべてのリージョンですぐに利用でき、顧客による変更は必要ありません。
サービス タグ
Azure AI Video Indexer が ネットワーク サービス タグの一部になりました。 Video Indexer は、多くの場合、他の Azure リソース (Azure Storage など) にアクセスする必要があります。 ネットワーク セキュリティ グループを使用してリソースへの受信トラフィックをセキュリティで保護する場合、組み込みサービス タグの一部として Video Indexer を選択できるようになりました。 これにより、サービス タグにパブリック IP が設定されるため、セキュリティ管理が簡素化されます。
著名人認識の切り替え
アカウント レベル (クラシック アカウントのみ) で著名認識モデルを有効または無効にできるようになりました。 モデルをオンまたはオフにするには、[モデルのカスタマイズ]>モデルのオン/オフを切り替えます。 モデルを無効にすると、Video Indexer の分析情報には有名人モデルの出力は含まれません。また、著名人モデル パイプラインは実行されません。
Azure AI Video Indexer のリポジトリ名
5 月 1 日以降、Azure AI Video Indexer ウィジェットのリポジトリが新たに更新され、名前が変更されました。 代わりに https://www.npmjs.com/package/@azure/video-indexer-widgets を使用してください
2022 年 4 月
Azure Video Analyzer for Media の名前を Azure AI Video Indexer に戻しました
現在は、Azure Video Analyzer for Media の製品名は Azure AI Video Indexer とすべての製品関連資産 (Web ポータル、マーケティング資料) です。 これは下位互換性のある変更であり、API とリンクには影響しません。 Azure AI Video Indexer の新しいロゴ:
2022 年 3 月
クローズド キャプション ファイルで、話者の属性を含むファイルがサポートされるようになりました
Azure AI Video Indexer を使用すると、ダウンロードするクローズド キャプション ファイルに基づいてスピーカーの特性を含めることができます。 話者の属性を含めるには、[ダウンロード] -> [クローズド キャプション] -> を選択します。クローズド キャプションのダウンロード可能なファイル形式 (SRT、VTT、TTML、TXT、または CSV) を選択し、[スピーカーを含める] チェック ボックスをオンにします。
ウィジェット オファリングの機能強化
次の改良が行われました。
- Azure AI Video Indexer ウィジェットでは、ウィジェットのパラメーターで複数のロケールがサポートされています。
- 分析ウィジェットでは、初期検索パラメーターと複数の並べ替えオプションがサポートされています。
- 分析ウィジェットには、間違いを避けるために顔を削除する前の確認手順も含まれています。
- ウィジェットのカスタマイズで、文字列としての幅がサポートされるようになりました (たとえば、100%、100vw)。
2022 年 2 月
政府のクラウドの ARM に基づく Azure AI Video Indexer アカウント管理のパブリック プレビュー
Azure AI Video Indexer Web サイトは、パブリック プレビューで ARM に基づくアカウント管理をサポートするようになりました (2021 年 11 月のリリース ノートを参照)。
オープンソース コードを活用して ARM ベースのアカウントを作成する
ソリューション開発者向けに、Azure AI Video Indexer の作成、読み取り、更新、削除 (CRUD) ARM API を使用するための HTTP 呼び出しを含む、新しいコード サンプルを追加しました。
2022 年 1 月
オーディオ効果検出の向上
オーディオ効果検出機能が改善され、次のクラスに対して検出率が向上しました。
- 観客の反応 (声援、拍手、ブーイング)、
- 銃声または爆発、
- 笑い声
詳細については、「オーディオ効果の検出」を参照してください。
Web サイトでの STT、翻訳、検索に対する新しいソース言語のサポート
Azure AI Video Indexer では、Azure AI Video Indexer の Web サイトでヘブライ語 (he-IL)、ポルトガル語 (pt-PT)、ペルシャ語 (fa-IR) での STT (音声変換)、翻訳、検索に対するソース言語のサポートが導入されています。 Azure AI Video Indexer の Web サイトとウィジェットでのこれらの言語による文字起こし、翻訳、検索の機能もサポートされます。
2021 年 12 月
プロジェクト機能が一般提供になりました
プロジェクト機能が一般提供になり、実稼働のための準備が整いました。 "プレビューから GA" への移行に関連する価格への影響はありません。 「ビデオ クリップをプロジェクトに追加する」を参照してください。
API レベルでの STT、翻訳、検索に対する新しいソース言語のサポート
Azure AI Video Indexer では、API レベルでヘブライ語 (he-IL)、ポルトガル語 (pt-PT)、ペルシャ語 (fa-IR) での STT (音声変換)、翻訳、検索に対するソース言語のサポートが導入されています。
一致した人の検出機能
Azure AI Video Indexer の詳細なビデオ設定を使ってビデオにインデックスを付ける際に、新しい一致した人の検出機能を表示できます。 メディア ファイルに観察対象の人物がいる場合は、メディア プレーヤーを使用して、各自を一致させた特定の人物を表示できるようになりました。
2021 年 11 月
ARM に基づく Azure AI Video Indexer アカウント管理のパブリック プレビュー
Azure AI Video Indexer では、Azure Resource Manager (ARM) ベースのアカウント管理のパブリック プレビューが導入されています。 ARM ベースの Azure AI Video Indexer API を活用して、Azure portal からアカウントを作成、編集、削除することができます。
Note
政府のクラウドには、Azure AI Video Indexer API および Azure portal からの CRUD ARM ベースのアカウントのサポートが含まれています。
現在、Azure AI Video Indexer の Web サイトはサポートされていません。
詳細については、Azure AI Video Indexer アカウントの作成に関するページを参照してください。
人物の衣服の検出
Azure AI Video Indexer の詳細なビデオ設定を使ってビデオにインデックスを付ける際に、新しい人物の衣服の検出機能を表示できます。 メディア ファイルで検出されたユーザーがいる場合は、メディア プレーヤーを通じて着ている服の種類を表示できるようになりました。
顔の境界ボックス (プレビュー)
メディア ファイルのインデックス作成中に検出された顔の境界ボックスをオンにできるようになりました。 顔の境界ボックス機能は、標準、基本、または高度なインデックス作成プリセットを選んでファイルのインデックスを作成するときに使用できます。
境界ボックスはプレーヤーを通じて有効にできます。
2021 年 10 月
Azure AI Video Indexer パッケージを使ってアプリにウィジェットを埋め込む
新しい Azure AI Video Indexer (AVAM) @azure/video-analyzer-for-media-widgets
npm パッケージを使って、アプリに insights
ウィジェットを追加し、ニーズに合わせてカスタマイズします。
新しい AVAM パッケージを使うと、iframe
要素を追加してコグニティブな分析情報ウィジェットを埋め込むのではなく、ウィジェットとアプリを簡単に埋め込んで通信できます。 詳細は、アプリに Azure AI Video Indexer のウィジェットを埋め込んでカスタマイズする方法に関するページを参照してください。
2021 年 8 月
ビデオまたはオーディオ ファイルのインデックスの再作成
インデックス作成プロセス中に失敗したビデオまたはオーディオ ファイルのインデックスを再作成するオプションが追加されました。
アクセシビリティ サポートの向上
CSS、テーマ、およびアクセシビリティに関連するバグを修正しました。
- ハイ コントラスト
- ポータルのアカウント設定と分析情報ビュー。
2021 年 7 月
メディア占有ユニットの自動スケーリング
2021 年 8 月 1 日より、Azure AI Video Indexer で Media 予約ユニット (MRU) が有効 、 Azure Media Services による自動スケーリングが行われます。そのため、Azure AI Video Indexer を使用して管理する必要はありません。 これにより、自動スケーリングされるビジネス ニーズに応じて、多くの場合では価格を下げることができるなど、価格の最適化が可能になります。
2021 年 6 月
6 つの新しいリージョンにデプロイされた Azure AI Video Indexer
フランス中部、米国中部、ブラジル南部、米国中西部、韓国中部、および西日本リージョンで、Azure AI Video Indexer の有料アカウントを作成できるようになりました。
2021 年 5 月
音声テキスト変換 (STT)、翻訳、検索に対する新しいソース言語のサポート
Azure AI Video Indexer では、中国語 (広東語) ('zh-HK')、オランダ語 (オランダ) ('Nl-NL')、チェコ語 ('Cs-CZ')、ポーランド語 ('Pl-PL')、スウェーデン語 (スウェーデン) ('Sv-SE')、ノルウェー語 ('nb-NO')、フィンランド語 ('fi-FI')、カナダ フランス語 ('fr-CA')、タイ語 ('th-TH')、アラビア語: (アラブ首長国連邦) ('ar-AE'、'ar-EG')、(イラク) ('ar-IQ')、(ヨルダン) ('ar-JO')、(クウェート) ('ar-KW')、(レバノン) ('ar-LB')、(オマーン) ('ar-OM')、(カタール) ('ar-QA')、(パレスチナ自治政府) ('ar-PS')、(シリア) ('ar-SY')、トルコ語 ('tr-TR') で STT、翻訳、検索がサポートされるようになりました。
これらの言語は、API と Azure AI Video Indexer の Web サイトの両方で使用できます。 [ビデオのソース言語] の下にあるコンボ ボックスから言語を選択してください。
Azure AI Video Indexer の新しいテーマ
新しいテーマ ('ライト' および 'ダーク' のテーマとともに 'Azure') を使用できます。 テーマを選択するには、Web サイトの右上隅にある歯車アイコンを選択し、 ユーザー設定でテーマを見つけます。
利用できる新しいオープンソース コード
GitHub リポジトリで、新しい 3つの GitHub プロジェクトを利用できます。
新しく追加されたウィジェットのカスタマイズを活用するためのコード。
ビデオ ライブラリに重複除去を追加するためのソリューション。
プレーヤーで (観察対象人物の) 境界ボックスを切り替える新しいオプション
詳細なビデオ設定を使用してビデオにインデックスを付ける際に、観察対象人物の新たな機能を表示できます。 メディア ファイルで検出された人物がいる場合、Media Player を通じて検出された人物の境界ボックスを有効にすることができます。
2021 年 4 月
Video Indexer サービスの名前が、Azure AI Video Indexer に変更されました。
ポータルでのアップロード エクスペリエンスの向上
Azure AI Video Indexer の Web サイトに新しいアップロード エクスペリエンスが導入されました。 メディア ファイルをアップロードするには、[メディア ファイル] タブから [アップロード] ボタンを押します。
gov-cloud で利用できる新しい開発者ポータル
Azure AI Video Indexer API の開発者ポータルが、米国政府向け Azure でも利用できるようになりました。
観察されたユーザーの検出 (プレビュー)
Azure AI Video Indexer を使用して、ビデオ内の観察対象の人物を検出し、その人物のビデオ フレーム内の位置、人物が現れたときの正確なタイムスタンプ (開始、終了) などの情報を提供するようになりました。 この API では、検出された各人物インスタンスの境界ボックス座標 (ピクセル単位) が、その信頼度を含めて返されます。
たとえば、ある人物がビデオに映っている場合、検出操作を行うと、その人物の姿形がビデオ フレーム内の座標と共に一覧表示されます。 この機能を使用して、ビデオ内でその人物の足取りを判別できます。 ビデオ内に同一人物のインスタンスが複数存在するかどうかも判別できます。
新しく追加された観察されたユーザー検出機能は、 Advanced オプション ->Advanced video または Advanced video + audio プリセットを選択して、ファイルのインデックスを作成するときに使用できます (ビデオ + オーディオ インデックス)。 標準および基本的なインデックス作成プリセットには、この新しい高度なモデルは含まれません。
Azure AI Video Indexer Web サイトでビデオの分析情報を表示することを選択すると、検出されたすべてのユーザーのサムネイルが表示された [Observed People detection]\(観察されたユーザーの検出\) がページに表示されます。 人物のサムネイルを選択し、その人物が映っている場面をビデオ プレーヤーで確認できます。
この機能は、Azure AI Video Indexer によって生成される JSON ファイルでも使用できます。 詳細については、「 ビデオで観察されたユーザー」を参照してください。
オーディオ エフェクト検出 (プレビュー) を使用して検出された音響イベント
検出された音響イベントをクローズド キャプション ファイルで確認できるようになりました。 このファイルは、Azure AI Video Indexer Web サイトからダウンロードでき、GetArtifact API の成果物として使用できます。
オーディオ エフェクト検出 (プレビュー) コンポーネントを使用して、さまざまな音響イベントを検出し、それらをさまざまな音響カテゴリ (発砲、叫び声、観客の反応など) に分類します。 詳細については、「オーディオ効果の検出」を参照してください。
2021 年 3 月
音声分析
音声分析が、さまざまな価格で新たに追加された音声機能のバンドルで利用できるようになりました。 新しい基本音声分析プリセットは、音声の文字起こしの抽出、出力キャプションと字幕の書式設定のみを備えた低コストのオプションです。 基本音声プリセットからは、2 つの別個の測定 (文字起こし分、およびキャプションと字幕の書式設定分) が生成されて請求書に計上されます。 価格の詳細については、Media Services の価格に関する記事を参照してください。
新たに追加されたバンドルは、[詳細オプション] ->[Basic Audio]\(基本音声\) プリセット ([動画 + オーディオのインデックス作成] ドロップダウン ボックスの下) を選んで、ファイルのインデックスを作成または再作成したときに使用できます。
新しい開発者ポータル
Azure AI Video Indexer には、新しい developer ポータルがあります。 新しい Azure AI Video Indexer API を試して、関連するすべてのリソースを 1 か所 ( GitHub リポジトリ) で見つけますStack overflow、 Azure AI Video Indexer tech community 関連するブログ投稿、 Azure AI Video Indexer の FAQ、 User Voice を使用してフィードバックと提案機能を提供し、ウィジェットのコード サンプルを含む 'CodePen' リンク 。
分析情報ウィジェットの高度なカスタマイズ機能
Azure AI Video Indexer の分析情報ウィジェットを独自のサービスに埋め込んで、そのスタイルとデータをカスタマイズするための SDK が利用可能になりました。 この SDK では、Azure AI Video Indexer の標準の分析情報ウィジェットと、完全にカスタマイズ可能な分析情報ウィジェットがサポートされています。 Azure AI Video Indexer の GitHub リポジトリからコード サンプルを入手できます。 この高度なカスタマイズ機能を使用すると、ソリューション開発者はカスタム スタイル設定を適用し、(Azure AI Video Indexer の分析情報の有無に関係なく) 顧客独自の AI データを取り込んで分析情報ウィジェットに表示できます。
Azure AI Video Indexer が米国中北部、米国西部、カナダ中部にデプロイされました
これで、米国中北部、米国西部、カナダ中部のリージョンで Azure AI Video Indexer 有料アカウントを作成できるようになりました。
音声テキスト変換 (STT)、翻訳、検索に対する新しいソース言語のサポート
Azure AI Video Indexer では、デンマーク語 ('da-DK')、ノルウェー語 ('nb-NO')、スウェーデン語 ('sv-SE')、フィンランド語 ('fi-FI')、カナダ フランス語 ('fr-CA')、タイ語 ('th-TH')、アラビア語 ('ar-BH'、'ar-EG'、'ar-IQ'、'ar-JO'、'ar-KW'、'ar-LB'、'ar-OM'、'ar-QA'、'ar-S'、'ar-SY')、およびトルコ語 ('tr-TR') で、STT、翻訳、検索がサポートされるようになりました。 これらの言語は、API と Azure AI Video Indexer の Web サイトの両方で使用できます。
Azure AI Video Indexer Web サイトでトピックで検索する
Azure AI Video Indexer の Web サイト ページの上部にある検索機能を使用して、特定のトピックでビデオを検索できるようになりました。
2021 年 2 月
複数アカウントの所有者
アカウント所有者ロールが Azure AI Video Indexer に追加されました。 ユーザーの追加、変更、削除を行ったり、それらのロールを変更できます。 アカウントを共有する方法の詳細については、ユーザーの招待に関するページを参照してください。
音声イベントの検出 (パブリック プレビュー)
Note
この機能は試用版アカウントでのみ使用できます。
Azure AI Video Indexer は、コンテンツの声以外のセグメントで、銃声、ガラスの割れる音、アラーム、サイレン、爆発音、犬が吠える声、叫び声、笑い声、観客の反応 (声援、拍手、ブーイング)、静寂などの音声効果を検出できるようになりました。
新たに追加された音声効果機能は、[詳細オプション] ->[Advanced audio]\(高度なオーディオ\) プリセット ([動画 + オーディオのインデックス作成] の下) を選んでファイルのインデックスを作成したときに使用できます。 標準のインデックス作成には、静寂と観客の反応だけが含まれます。
以前の音声効果モデルに含まれていた拍手イベント タイプは、観客の反応イベント タイプの一部として抽出されるようになりました。
Azure AI Video Indexer の Web サイトでビデオの分析情報を確認するように選択すると、音声効果がページに表示されます。
名前付きエンティティの機能強化
抽出された人物と場所の一覧は、全体的に拡張および更新されています。
さらに、モデルには、ビデオの "Sam" や "Home" など、有名ではないコンテキスト内のユーザーと場所が含まれるようになりました。
2021 年 1 月
Azure AI Video Indexer が米国政府のクラウドにデプロイされました
Azure AI Video Indexer の有料アカウントをバージニアおよびアリゾナのリージョンにある米国政府のクラウドで作成できるようになりました。 Azure AI Video Indexer の試用版オファリングは、記載のリージョンでは利用できません。 詳細については、Azure AI Video Indexer のドキュメントを参照してください。
Azure AI Video Indexer がインド中部リージョンにデプロイされました
Azure AI Video Indexer の有料アカウントをインド中部リージョンで作成できるようになりました。
Azure AI Video Indexer の Web サイト エクスペリエンス向けの新しいダーク モード
Azure AI Video Indexer の Web サイト エクスペリエンスがダーク モードで利用できるようになりました。 ダーク モードを有効にするには、設定パネルを開き、[ダーク モード] オプションのトグルをオンにします。
2020 年 12 月
Azure AI Video Indexer がスイス西部とスイス北部にデプロイされました
Azure AI Video Indexer の有料アカウントをスイス西部とスイス北部リージョンで作成できるようになりました。
2020 年 10 月
Azure AI Video Indexer の Web サイトで予定されている認証の変更
2021 年 3 月 1 日以降、Facebook または LinkedIn を使用して、 Azure AI Video Indexer Web サイトdeveloper ポータル にサインアップしてサインインできなくなります。
Entra ID、Microsoft、Google のいずれかのプロバイダーを使用してサインアップしてサインインできます。
Note
LinkedIn と Facebook に接続されている Azure AI Video Indexer アカウントは、2021 年 3 月 1 日以降はアクセスできません。
引き続きアクセスできるようにAzure AI Video Indexer アカウントに Entra ID、Microsoft、または Google の電子メールを送信する必要があります。 招待に関するページの説明に従って、サポートされているプロバイダーの追加の所有者を加えることができます。
あるいは、有料アカウントを作成し、データを移行できます。
2020 年 8 月
Azure AI Video Indexer Web サイトのモバイル設計
Azure AI Video Indexer の Web サイト エクスペリエンスが、モバイル デバイスをサポートするようになりました。 ユーザー エクスペリエンスは、モバイル画面のサイズに合わせて最適化されます (カスタマイズ UI は除く)。
アクセシビリティの向上とバグ修正
WCAG (Web コンテンツ アクセシビリティ ガイドライン) の一部として、Azure AI Video Indexer の Web サイト エクスペリエンスは、Microsoft アクセシビリティ標準の一部としてグレード C に一致しています。 キーボード ナビゲーション、プログラムによるアクセス、スクリーン リーダーに関連するいくつかのバグ修正および改善が行われました。
2020 年 7 月
GA になった複数言語の識別
複数言語の識別はプレビューから GA に移行され、運用環境で使用する準備ができています。
"プレビューから GA" への移行に関連する価格への影響はありません。
Azure AI Video Indexer Web サイトの改善
ビデオ ギャラリーでの調整
詳細な分析情報の検索用に、追加のフィルター機能を備えた新しい検索バーが追加されました。 検索結果も拡張されています。
複数のファイルを含むビデオ アーカイブの並べ替えと管理を行う機能を備えた新しいリスト ビュー。
選択と構成が容易な新しいパネル
選択とユーザーの構成が容易なサイド パネルが追加され、シンプルで迅速なアカウントの作成と共有や、構成の設定が可能になっています。
サイド パネルは、ユーザー設定やヘルプにも使用されます。
2020 年 6 月
トピックで検索
検索 API を使用して、特定のトピックでビデオを検索できるようになりました (API のみ)。
トピックは、textScope
(省略可能なパラメーター) の一部として追加されます。 詳細については API を参照してください。
ラベルの機能強化
ラベルのタグ付け機能がアップグレードされました。これにより、特定しやすいより視覚的なラベルが追加されます。
2020 年 5 月
Azure AI Video Indexer が米国東部にデプロイされました
Azure AI Video Indexer の有料アカウントを米国東部リージョン作成できるようになりました。
Azure AI Video Indexer の URL
Azure AI Video Indexer のリージョン エンドポイントはすべて、www でのみ始まるように統一されました。 必要な操作はありません。
今後は、ウィジェットを埋め込む場合も、Azure AI Video Indexer Web サイトにログインする場合も、www.videoindexer.ai にアクセスします。
また、wus.videoindexer.ai も www にリダイレクトされます。 詳細については、「お使いのアプリに Azure AI Video Indexer ウィジェットを埋め込む」を参照してください。
2020 年 4 月
新しいウィジェット パラメーターの機能
Insights ウィジェットには、language
と control
という新しいパラメーターが含まれています。
プレーヤー ウィジェットには、新しい locale
パラメーターがあります。 locale
と language
パラメーターは両方とも、プレーヤーの言語を制御します。
詳細については、「ウィジェットの種類」セクションを参照してください。
新しいプレーヤー スキン
新しいプレーヤー スキンが、更新されたデザインで利用可能になりました。
今後予定されている変更の準備をする
現在、次の API からアカウント オブジェクトが返されます。
アカウント オブジェクトには、
Url
の場所をポイントする フィールドがあります。 有料アカウントの場合、Url
フィールドは現在、パブリック Web サイトではなく、内部 URL をポイントしています。 今後数週間以内に変更し、 Azure AI Video Indexer Web サイト すべてのアカウントの URL (試用版と有料) を返します。内部 URL は使用しないでください。 Azure AI Video Indexer パブリック API を使用する必要があります。
Azure AI Video Indexer URL をアプリケーションに埋め込み、URL が Azure AI Video Indexer Web サイト または Azure AI Video Indexer API エンドポイント (
https://api.videoindexer.ai
) ではなく、リージョン エンドポイント (https://wus2.videoindexer.ai
など) を指している場合は、URL を再生成します。次のいずれかでこれを行うことができます。
URL を Azure AI Video Indexer ウィジェット API をポイントする URL (たとえば、分析情報ウィジェット) に置き換える
Azure AI Video Indexer Web サイトを使用して、新しい埋め込み URL を生成する
Playを押してビデオのページに移動>、</>埋め込みボタンを選択>、URL をアプリケーションにコピーします。
リージョン URL はサポートされておらず、今後数週間以内にブロックされます。
2020 年 1 月
追加言語に対するカスタム言語サポート
Azure AI Video Indexer で、ar-SY
、en-UK
、en-AU
のカスタム言語モデルがサポートされるようになりました (API のみ)。
アカウント削除アクションのタイムフレームの更新
アカウント削除アクションで、48 時間ではなく 90 日以内にアカウントが削除されるようになりました。
新しい Azure AI Video Indexer の GitHub リポジトリ
さまざまなプロジェクトを含む新しい Azure AI Video Indexer GitHub、ファースト ステップ ガイド、コード サンプルを使用できるようになりました。https://github.com/Azure-Samples/media-services-video-indexer
Swagger の更新
Azure AI Video Indexer で、認証と操作が 1 つのAzure AI Video Indexer OpenAPI 仕様 (swagger) に統合されました。 開発者は、Azure AI Video Indexer 開発者ポータルで API を見つけることができます。
2019 年 12 月
新しい API を使用して音声テキストを更新する
Update-Video-Index API を使用して、音声テキストの特定のセクションを更新します。
Azure AI Video Indexer Web サイトからアカウント構成を修正する
次のような問題を解決するために、Media Services 接続構成を更新できるようになりました。
- Azure Media Services のリソースが正しくない
- パスワードの変更
- Media Services リソースがサブスクリプション間で移動された
アカウント構成を修正するには、Azure AI Video Indexer Web サイトで、(所有者として) [設定] > [アカウント] タブの順に移動します。
Custom Vision アカウントを構成する
Azure AI Video Indexer Web サイトを使用して、有料アカウントで Custom Vision アカウントを構成します (以前は API でのみサポートされていました)。 これを行うには、Azure AI Video Indexer Web サイトにサインインし、[Model Customization] (モデルのカスタマイズ) ><モデル>> [構成] の順に選択します。
シーン、ショット、キーフレーム - 1 つの分析情報ウィンドウに表示されるようになりました
シーン、ショット、およびキーフレームは、使用とナビゲーションを容易にするために 1 つの分析情報に結合されるようになりました。 目的のシーンを選択すると、そこに含まれるショットとキーフレームが表示されます。
長いビデオ名に関する通知
ビデオ名が 80 文字より長い場合、Azure AI Video Indexer はアップロード時に状況を説明するエラーを表示します。
ストリーミング エンドポイントが無効になっているという通知
ストリーミング エンドポイントが無効になっている場合、Azure AI Video Indexer には、プレーヤー ページに状況を説明するエラーが表示されます。
エラー処理の改善
現在のインデックス再作成の変更が誤ってオーバーライドされないように、ビデオがアクティブにインデックス付けされている場合は、 Re-Index Video および Update Video Index API から状態コード 409 が返されるようになりました。
2019 年 11 月
韓国語のカスタム言語モデルのサポート
Azure AI Video Indexer では、API とポータルの両方で韓国語 (
ko-KR
) のカスタム言語モデルがサポートされるようになりました。音声テキスト変換 (STT) でサポートされる新しい言語
Azure AI Video Indexer API では、アラビア語 (レバント) (ar-SY)、英語 (英国) 地方言語 (en-GB)、および英語 (オーストラリア) 地方言語 (en-AU) の STT がサポートされるようになりました。
動画のアップロードでは、zh-HANS が zh-CN に置き換えられています。どちらもサポートされていますが、zh-CN の方がより正確であるため、推奨されています。
2019 年 10 月
ギャラリーでアニメーション化された文字を検索する
アニメーション化された文字のインデックスを作成すると、アカウントのビデオ ギャラリーで検索できるようになりました。
2019 年 9 月
IBC 2019 で発表されたさまざまな進化:
アニメーション文字の認識 (パブリック プレビュー)
Custom Vision との統合で、アニメーション コンテンツでグループを検出したり、文字を認識したりできるようになりました。
複数言語の識別 (パブリック プレビュー)
オーディオ トラックに含まれる複数の言語からセグメントを検出し、それに基づいて多言語のトランスクリプトを作成します。 初期サポート: 英語、スペイン語、ドイツ語、フランス語。 詳細については、「 多言語コンテンツの文字起こし」を参照してください。
人と場所に関して名前付きのエンティティを抽出する
自然言語処理 (NLP) を使用して、音声および視覚テキストからブランド、場所、および人物を抽出します。
編集タイプでショットを分類する
クローズアップ、ミディアムショット、ツーショット、屋内、屋外など、編集タイプでショットにタグを付けます。詳細については、「編集ショット タイプの検出」を参照してください。
トピック推論の機能強化 - 現在のレベル 2
トピック推論モデルでは、さらに細かな IPTC 分類に対応できるようになりました。 詳しくは、「Azure Media Services の AI を活用した新たなイノベーション」をお読みください。
2019 年 8 月の更新
Azure AI Video Indexer が英国南部にデプロイされました
Azure AI Video Indexer の有料アカウントを英国南部リージョンで作成できるようになりました。
利用可能になった新しい編集ショット タイプ分析情報
ビデオ ショットに追加された新しいタグにより、コンテンツ作成ワークフローで使用される次のような一般的な編集語句を識別するための "ショット タイプ" が提供されます: 超クローズアップ、クローズアップ、ワイド、中程度、2 ショット、屋外、室内、左の顔、右の顔 (JSON で使用可能)。
利用可能になった新しい人と場所のエンティティ抽出
Azure AI Video Indexer では、自然言語処理 (NLP) を介してビデオの OCR と文字起こしから名前付きの場所と人が識別されます。 Azure AI Video Indexer では、機械学習アルゴリズムを使用して、特定の場所 (エッフェル塔など) や人 (John Doe など) などのビデオでの言及が認識されます。
ネイティブ解像度でのキーフレームの抽出
Azure AI Video Indexer によって抽出されたキーフレームを、ビデオの元の解像度で使用できます。
GA になった画像からのカスタム顔モデルのトレーニング
画像からの顔のトレーニングが、プレビュー モードから GA になりました (API およびポータルで利用可能)。
Note
"プレビューから GA" への移行に関連する価格への影響はありません。
ギャラリー非表示の切り替えオプション
ユーザーは、ポータルからギャラリー タブを非表示にすることができます (サンプル タブの非表示と同様)。
URL の最大サイズの拡大
ビデオのインデックス作成時にサポートされる URL クエリ文字列が (2048 文字ではなく) 4096 文字になります。
多言語プロジェクトのサポート
異なる言語でインデックス付けされた複数のビデオに基づいて、プロジェクトを作成できるようになりました (API のみ)。
2019 年 7 月
ウィジェットとしてのエディター
Azure AI Video Indexer の AI エディターが、お客様のアプリケーションに埋め込むためのウィジェットとして提供されています。
ポータルでクローズド キャプション ファイルからカスタム言語モデルを更新する
お客様は、ポータルのカスタマイズ ページから、言語モデルの入力として VTT、SRT、TTML の各ファイル形式を指定できます。
2019 年 6 月
Azure AI Video Indexer が東日本にデプロイされました
Azure AI Video Indexer の有料アカウントを東日本リージョンで作成できるようになりました。
アカウントの作成および修復 API (プレビュー)
Azure Media Service の接続エンドポイントまたはキーを更新できる新しい API が追加されました。
アップロードでのエラー処理の向上
基になる Azure Media Services アカウントの構成に誤りがある場合には、説明のメッセージが返されます。
プレーヤー タイムラインのキーフレーム プレビュー
プレーヤーのタイムライン上の各時間に対するイメージ プレビューを表示できるようになりました。
エディターの半選択
エディターで特定の分析情報期間を選択した結果として選択されるすべての分析情報のプレビューを表示できるようになりました。
2019 年 5 月
クローズド キャプション ファイルからのカスタム言語モデルの更新
カスタム言語モデルの作成およびカスタム言語モデルの更新 API は、言語モデルの入力として、VTT、SRT、および TTML ファイル形式をサポートするようになりました。
ビデオ トランスクリプトの更新 API を呼び出すと、トランスクリプトが自動的に追加されます。 ビデオに関連付けられたトレーニング モデルも自動的に更新されます。 使用する言語モデルをカスタマイズおよびトレーニングする方法については、「Azure AI Video Indexer で言語モデルをカスタマイズする」を参照してください。
新しいダウンロード トランスクリプト形式 – TXT と CSV
Azure AI Video Indexer では、既にサポートされているクローズド キャプション形式 (SRT、VTT、TTML) に加えて、TXT および CSV 形式でのトランスクリプトのダウンロードをサポートするようになりました。