次の方法で共有


Transforms - Create Or Update

変換の作成または更新
新しい Transform を作成または更新します。

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Media/mediaServices/{accountName}/transforms/{transformName}?api-version=2022-07-01

URI パラメーター

名前 / 必須 説明
accountName
path True

string

Media Services アカウント名。

resourceGroupName
path True

string

Azure サブスクリプション内のリソース グループの名前。

subscriptionId
path True

string

Microsoft Azure サブスクリプションの一意識別子。

transformName
path True

string

変換名。

api-version
query True

string

クライアント要求で使用される API のバージョン。

要求本文

名前 必須 説明
properties.outputs True

TransformOutput[]

変換を生成する必要のある 1 つ以上の TransformOutput の配列。

properties.description

string

変換の省略可能な詳細説明。

応答

名前 説明
200 OK

Transform

OK

201 Created

Transform

作成済み

Other Status Codes

ErrorResponse

詳細なエラー情報。

Create or update a Transform

要求のサンプル

PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaServices/contosomedia/transforms/createdTransform?api-version=2022-07-01

{
  "properties": {
    "description": "Example Transform to illustrate create and update.",
    "outputs": [
      {
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  }
}

応答のサンプル

{
  "name": "createdTransform",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/createdTransform",
  "type": "Microsoft.Media/mediaservices/transforms",
  "properties": {
    "created": "2022-10-17T23:14:31.7664818Z",
    "description": "Example Transform to illustrate create and update.",
    "lastModified": "2022-10-17T23:14:31.7664818Z",
    "outputs": [
      {
        "onError": "StopProcessingJob",
        "relativePriority": "Normal",
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2022-10-17T23:14:31.7664818Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2022-10-17T23:14:31.7664818Z"
  }
}
{
  "name": "createdTransform",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/createdTransform",
  "type": "Microsoft.Media/mediaservices/transforms",
  "properties": {
    "created": "2022-10-17T23:14:31.7664818Z",
    "description": "Example Transform to illustrate create and update.",
    "lastModified": "2022-10-17T23:14:31.7664818Z",
    "outputs": [
      {
        "onError": "StopProcessingJob",
        "relativePriority": "Normal",
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2022-10-17T23:14:31.7664818Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2022-10-17T23:14:31.7664818Z"
  }
}

定義

名前 説明
AacAudio

高度なオーディオ コーデック (AAC) オーディオ エンコード設定について説明します。

AacAudioProfile

AAC でオーディオをエンコードするときに使用するエンコード プロファイル。

AnalysisResolution

ビデオを分析する最大解像度を指定します。 既定の動作は "SourceResolution" です。これにより、入力ビデオは分析時に元の解像度で維持されます。 "StandardDefinition" を使用すると、適切な縦横比を維持しながら、入力ビデオのサイズが標準定義に変更されます。 ビデオの解像度が高い場合にのみサイズが変更されます。 たとえば、1920x1080 入力は、処理前に 640 x 360 にスケーリングされます。 "StandardDefinition" に切り替えると、高解像度ビデオの処理にかかる時間が短縮されます。 また、このコンポーネントを使用するコストが削減される場合もあります (詳細については、を参照してください https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 ただし、サイズ変更されたビデオでは、最終的に小さすぎる顔が検出されない場合があります。

Audio

すべてのオーディオ コーデックの共通プロパティを定義します。

AudioAnalysisMode

実行するオーディオ分析操作のセットを決定します。 指定しない場合は、Standard AudioAnalysisMode が選択されます。

AudioAnalyzerPreset

Audio Analyzer プリセットは、音声の文字起こしを含む、事前に定義された AI ベースの分析操作のセットを適用します。 現在、プリセットは単一のオーディオ トラックでのコンテンツ処理をサポートしています。

AudioOverlay

オーディオ オーバーレイのプロパティについて説明します。

BlurType

ぼかしの種類

BuiltInStandardEncoderPreset

Standard Encoder を使用して入力ビデオをエンコードするための組み込みのプリセットについて説明します。

Complexity

エンコーダーの設定を構成して、速度と品質のバランスを制御できます。 例: [複雑さ] を [速度] に設定すると、エンコードが高速になりますが、圧縮効率は低下します。

CopyAudio

コーデック フラグ。入力オーディオ ビットストリームをコピーするようにエンコーダーに指示します。

CopyVideo

コーデック フラグ。エンコーダーに対して、再エンコードなしで入力ビデオ ビットストリームをコピーするように指示します。

createdByType

リソースを作成した ID の種類。

DDAudio

Dolby Digital Audio Codec (AC3) オーディオ エンコード設定について説明します。 Dolby Digital Audio サポートの現在の実装は、1((mono)、2(ステレオ)、6(5.1side)のオーディオ チャネル番号です。音声サンプリング周波数レート: 32K/44.1K/48K Hz;AC3 仕様でサポートされるオーディオ ビットレートの値: 32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。

Deinterlace

インターレース解除の設定について説明します。

DeinterlaceMode

インターレース解除モード。 既定値は AutoPixelAdaptive です。

DeinterlaceParity

インターレース解除のフィールド パリティは、既定値は Auto です。

EncoderNamedPreset

ビデオのエンコードに使用する組み込みのプリセット。

EntropyMode

このレイヤーに使用するエントロピ モード。 指定しない場合、エンコーダーはプロファイルとレベルに適したモードを選択します。

ErrorAdditionalInfo

リソース管理エラーの追加情報。

ErrorDetail

エラーの詳細。

ErrorResponse

エラー応答

FaceDetectorPreset

存在するすべての顔を検出 (および必要に応じて編集) するためにビデオを分析するときに使用されるすべての設定について説明します。

FaceRedactorMode

このモードでは、1) 分析 - 検出専用の設定から選択できます。このモードでは、ビデオ全体で顔の外観をマークするメタデータ JSON ファイルが生成されます。可能な場合、同じ人物の外観には同じ ID が割り当てられます。2) 結合 - 検出された顔をさらに編集 (ぼかし) します。 3) 編集 - これにより、2 パス プロセスが可能になり、検出された顔のサブセットの選択的なやり直しが可能になります。メタデータ ファイルは、ソース ビデオと共に、以前の分析パスから取得され、ユーザーが選択した ID のサブセットを再処理する必要があります。

Fade

入力メディアに適用されるフェード効果のプロパティについて説明します。

Filters

エンコード前に入力メディアに適用されるインターレース解除、回転など、すべてのフィルター処理操作について説明します。

H264Complexity

エンコード設定を選択する方法をエンコーダーに指示します。 既定値は Balanced です。

H264Layer

H.264 ビデオ コーデックを使用して、入力ビデオを目的の出力ビットレート レイヤーにエンコードするときに使用する設定について説明します。

H264RateControlMode

ビデオレート制御モード

H264Video

H.264 コーデックを使用してビデオをエンコードするためのすべてのプロパティについて説明します。

H264VideoProfile

現在、ベースライン、メイン、高、高 422、高 444 がサポートされています。 既定値は Auto です。

H265Complexity

エンコード設定を選択する方法をエンコーダーに指示します。 品質は、より高い圧縮率を提供しますが、コストが高く、コンピューティング時間が長くなります。 速度は比較的大きなファイルを生成しますが、高速で経済的です。 既定値は Balanced です。

H265Layer

H.265 ビデオ コーデックを使用して、入力ビデオを目的の出力ビットレート レイヤーにエンコードするときに使用する設定について説明します。

H265Video

H.265 コーデックを使用してビデオをエンコードするためのすべてのプロパティについて説明します。

H265VideoProfile

現在、Main がサポートされています。 既定値は Auto です。

Image

入力ビデオからサムネイルを生成するための基本的なプロパティについて説明します

ImageFormat

出力イメージ ファイルのプロパティについて説明します。

InsightsType

サービスで生成する分析情報の種類を定義します。 使用できる値は、"AudioInsightsOnly"、"VideoInsightsOnly"、および "AllInsights" です。 既定値は AllInsights です。 これを AllInsights に設定し、入力がオーディオのみの場合は、オーディオ分析情報のみが生成されます。 同様に、入力がビデオのみの場合は、ビデオ分析情報のみが生成されます。 入力の一部がビデオのみであると予想される場合は、AudioInsightsOnly を使用しないことをお勧めします。または、入力の一部がオーディオのみであると予想される場合は、VideoInsightsOnly を使用します。 このような状態のジョブはエラーになります。

InterleaveOutput

オーディオとビデオをコンテナー形式で格納する方法を制御する出力のインターリーブ モードを設定します。 例: インターリーブ出力を NonInterleavedOutput に設定して、個別の MP4 ファイルでオーディオのみの出力とビデオのみの出力を生成します。

JpgFormat

JPEG サムネイルを生成するための設定について説明します。

JpgImage

入力ビデオから一連の JPEG 画像を生成するためのプロパティについて説明します。

JpgLayer

入力ビデオから JPEG 画像を生成する設定について説明します。

Mp4Format

出力 ISO MP4 ファイルのプロパティについて説明します。

MultiBitrateFormat

GOP アラインマルチビットレート ファイルのコレクションを生成するためのプロパティについて説明します。 既定の動作では、すべてのオーディオと共に多重化されたビデオ レイヤーごとに 1 つの出力ファイルが生成されます。 生成される正確な出力ファイルは、outputFiles コレクションを指定することによって制御できます。

OnErrorType

変換では、複数の出力を定義できます。 このプロパティは、1 つの出力が失敗した場合にサービスが実行する必要がある処理を定義します。他の出力の生成を続行するか、他の出力を停止します。 ジョブの全体的な状態には、"ContinueJob" で指定された出力のエラーは反映されません。 既定値は 'StopProcessingJob' です。

OutputFile

生成された出力ファイルを表します。

PngFormat

PNG サムネイルを生成するための設定について説明します。

PngImage

入力ビデオから一連の PNG 画像を生成するためのプロパティについて説明します。

PngLayer

入力ビデオから PNG イメージを生成する設定について説明します。

PresetConfigurations

エンコーダーのオプションの構成設定のオブジェクト。

Priority

Transform 内の TransformOutput の相対優先度を設定します。 これにより、TransformOutputs の処理にサービスで使用される優先順位が設定されます。 既定の優先度は Normal です。

Rectangle

処理する前に、入力メディアに適用される四角形ウィンドウのプロパティについて説明します。

Rotation

エンコードされる前に、入力ビデオに適用される回転 (ある場合)。 既定値は Auto です

StandardEncoderPreset

Standard Encoder を使用して入力ビデオをエンコードするときに使用されるすべての設定について説明します。

StretchMode

サイズ変更モード - 入力ビデオを目的の出力解像度に合わせてサイズ変更する方法。 既定値は AutoSize です

systemData

リソースの作成と最後の変更に関連するメタデータ。

Transform

変換は、コード変換や分析情報の抽出など、入力メディアから目的の出力を生成するためのルールまたは命令をカプセル化します。 変換が作成されたら、ジョブを作成して入力メディアに適用できます。

TransformOutput

TransformOutput のプロパティについて説明します。これは、目的の出力の生成時に適用される規則です。

TransportStreamFormat

MPEG-2 トランスポート ストリーム (ISO/IEC 13818-1) 出力ビデオ ファイルを生成するためのプロパティについて説明します。

Video

入力ビデオをエンコードするための基本的なプロパティについて説明します。

VideoAnalyzerPreset

オーディオとビデオの両方から分析情報 (豊富なメタデータ) を抽出し、JSON 形式ファイルを出力するビデオ アナライザー プリセット。

VideoOverlay

ビデオ オーバーレイのプロパティについて説明します。

VideoSyncMode

ビデオ同期モード

AacAudio

高度なオーディオ コーデック (AAC) オーディオ エンコード設定について説明します。

名前 説明
@odata.type string:

#Microsoft.Media.AacAudio

派生型の識別子。

bitrate

integer

出力エンコードされたオーディオのビットレート (ビット/秒)。

channels

integer

オーディオ内のチャネルの数。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

profile

AacAudioProfile

AAC でオーディオをエンコードするときに使用するエンコード プロファイル。

samplingRate

integer

ヘルツでのエンコードに使用するサンプリング レート。

AacAudioProfile

AAC でオーディオをエンコードするときに使用するエンコード プロファイル。

名前 説明
AacLc

string

出力オーディオを AAC 低複雑度プロファイル (AAC-LC) にエンコードすることを指定します。

HeAacV1

string

出力オーディオを HE-AAC v1 プロファイルにエンコードすることを指定します。

HeAacV2

string

出力オーディオを HE-AAC v2 プロファイルにエンコードすることを指定します。

AnalysisResolution

ビデオを分析する最大解像度を指定します。 既定の動作は "SourceResolution" です。これにより、入力ビデオは分析時に元の解像度で維持されます。 "StandardDefinition" を使用すると、適切な縦横比を維持しながら、入力ビデオのサイズが標準定義に変更されます。 ビデオの解像度が高い場合にのみサイズが変更されます。 たとえば、1920x1080 入力は、処理前に 640 x 360 にスケーリングされます。 "StandardDefinition" に切り替えると、高解像度ビデオの処理にかかる時間が短縮されます。 また、このコンポーネントを使用するコストが削減される場合もあります (詳細については、を参照してください https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 ただし、サイズ変更されたビデオでは、最終的に小さすぎる顔が検出されない場合があります。

名前 説明
SourceResolution

string

StandardDefinition

string

Audio

すべてのオーディオ コーデックの共通プロパティを定義します。

名前 説明
@odata.type string:

#Microsoft.Media.Audio

派生型の識別子。

bitrate

integer

出力エンコードされたオーディオのビットレート (ビット/秒)。

channels

integer

オーディオ内のチャネルの数。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

samplingRate

integer

ヘルツでのエンコードに使用するサンプリング レート。

AudioAnalysisMode

実行するオーディオ分析操作のセットを決定します。 指定しない場合は、Standard AudioAnalysisMode が選択されます。

名前 説明
Basic

string

このモードを使用すると、音声からテキストへの文字起こし、VTT 字幕またはキャプション ファイルの生成が実行されます。 このモードの出力には、キーワード、文字起こし、タイミング情報のみを含む Insights JSON ファイルなどがあります。 このモードには、自動言語検出と話者のダイアライゼーションは含まれていません。

Standard

string

Basic モードに含まれるすべての操作を実行し、さらに言語検出と話者のダイアライゼーションを実行します。

AudioAnalyzerPreset

Audio Analyzer プリセットは、音声の文字起こしを含む、事前に定義された AI ベースの分析操作のセットを適用します。 現在、プリセットは単一のオーディオ トラックでのコンテンツ処理をサポートしています。

名前 説明
@odata.type string:

#Microsoft.Media.AudioAnalyzerPreset

派生型の識別子。

audioLanguage

string

BCP-47 形式の 'language tag-region' (例: 'en-US') を使用した入力内のオーディオ ペイロードの言語。 コンテンツの言語がわかっている場合は、指定することをお勧めします。 言語の自動検出は基本モードに含まれていないため、AudioAnalysisMode::Basic に対して言語を明示的に指定する必要があります。 言語が指定されていないか、null 値に設定されている場合、自動言語検出は、最初に検出された言語を選択し、ファイルの実行中、選択された言語で処理を行います。 現在、最初の言語が検出された後に複数の言語を動的に切り替えることはサポートされていません。 自動検出は、明確に識別可能な音声を使用したオーディオ録音に最適です。 自動検出で言語が見つからない場合、文字起こしは 'en-US' にフォールバックします。"サポートされている言語の一覧については、こちらを参照してください。 https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions

object

プリセット自体で公開されていないパラメーターのキー値ペアを含むディクショナリ

mode

AudioAnalysisMode

実行するオーディオ分析操作のセットを決定します。 指定しない場合は、Standard AudioAnalysisMode が選択されます。

AudioOverlay

オーディオ オーバーレイのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.AudioOverlay

派生型の識別子。

audioGainLevel

number

オーバーレイ内のオーディオのゲイン レベル。 値は [0, 1.0] の範囲内である必要があります。 既定値は 1.0 です。

end

string

オーバーレイが終了する入力ビデオを参照する終了位置。 値は ISO 8601 形式である必要があります。 たとえば、PT30S は、入力ビデオに 30 秒でオーバーレイを終了します。 指定しない場合、または値が入力ビデオの継続時間より大きい場合は、オーバーレイメディアの継続時間が入力ビデオの継続時間よりも長い場合、オーバーレイは入力ビデオの終了まで適用されます。それ以外の場合、オーバーレイはオーバーレイメディアの継続時間と同じ長さになります。

fadeInDuration

string

オーバーレイが入力ビデオにフェードインする期間。 値は ISO 8601 期間形式である必要があります。 指定しない場合、既定の動作ではフェードインは行われません (PT0S と同じです)。

fadeOutDuration

string

オーバーレイが入力ビデオからフェードアウトする期間。 値は ISO 8601 期間形式である必要があります。 指定しない場合、既定の動作ではフェードアウトは行われません (PT0S と同じです)。

inputLabel

string

オーバーレイとして使用されるジョブ入力のラベル。 Input には、1 つのファイルを指定する必要があります。 JPG、PNG、GIF、または BMP 形式のイメージ ファイル、オーディオファイル (WAV、MP3、WMA、M4A ファイルなど)、またはビデオ ファイルを指定できます。 サポートされているオーディオとビデオのファイル形式の完全な一覧については、「」を参照してください https://aka.ms/mesformats

start

string

オーバーレイが開始される入力ビデオを参照する開始位置。 値は ISO 8601 形式である必要があります。 たとえば、PT05S は、入力ビデオに 5 秒でオーバーレイを開始します。 指定しない場合、オーバーレイは入力ビデオの先頭から開始されます。

BlurType

ぼかしの種類

名前 説明
Black

string

黒: ブラック アウト フィルター

Box

string

ボックス: デバッグ フィルター、境界ボックスのみ

High

string

高: ぼかしフィルターを混同する

Low

string

低:ボックスカーぼかしフィルター

Med

string

Med: ガウス ぼかしフィルター

BuiltInStandardEncoderPreset

Standard Encoder を使用して入力ビデオをエンコードするための組み込みのプリセットについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.BuiltInStandardEncoderPreset

派生型の識別子。

configurations

PresetConfigurations

エンコーダーのオプションの構成設定。 構成は、ContentAwareEncoding と H265ContentAwareEncoding BuiltInStandardEncoderPreset でのみサポートされます。

presetName

EncoderNamedPreset

ビデオのエンコードに使用する組み込みのプリセット。

Complexity

エンコーダーの設定を構成して、速度と品質のバランスを制御できます。 例: [複雑さ] を [速度] に設定すると、エンコードが高速になりますが、圧縮効率は低下します。

名前 説明
Balanced

string

速度と品質のバランスを取る設定を使用するようにエンコーダーを構成します。

Quality

string

エンコード時間全体の短縮を犠牲にして、より高品質の出力を生成するように最適化された設定を使用するようにエンコーダーを構成します。

Speed

string

エンコードを高速化するために最適化された設定を使用するようにエンコーダーを構成します。 エンコード時間を短縮するために品質が犠牲になります。

CopyAudio

コーデック フラグ。入力オーディオ ビットストリームをコピーするようにエンコーダーに指示します。

名前 説明
@odata.type string:

#Microsoft.Media.CopyAudio

派生型の識別子。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

CopyVideo

コーデック フラグ。エンコーダーに対して、再エンコードなしで入力ビデオ ビットストリームをコピーするように指示します。

名前 説明
@odata.type string:

#Microsoft.Media.CopyVideo

派生型の識別子。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

createdByType

リソースを作成した ID の種類。

名前 説明
Application

string

Key

string

ManagedIdentity

string

User

string

DDAudio

Dolby Digital Audio Codec (AC3) オーディオ エンコード設定について説明します。 Dolby Digital Audio サポートの現在の実装は、1((mono)、2(ステレオ)、6(5.1side)のオーディオ チャネル番号です。音声サンプリング周波数レート: 32K/44.1K/48K Hz;AC3 仕様でサポートされるオーディオ ビットレートの値: 32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。

名前 説明
@odata.type string:

#Microsoft.Media.DDAudio

派生型の識別子。

bitrate

integer

出力エンコードされたオーディオのビットレート (ビット/秒)。

channels

integer

オーディオ内のチャネルの数。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

samplingRate

integer

ヘルツでのエンコードに使用するサンプリング レート。

Deinterlace

インターレース解除の設定について説明します。

名前 説明
mode

DeinterlaceMode

インターレース解除モード。 既定値は AutoPixelAdaptive です。

parity

DeinterlaceParity

インターレース解除のフィールド パリティは、既定値は Auto です。

DeinterlaceMode

インターレース解除モード。 既定値は AutoPixelAdaptive です。

名前 説明
AutoPixelAdaptive

string

入力ビデオの各フレームに自動ピクセル アダプティブ インターレース解除を適用します。

Off

string

ソース ビデオのインターレース解除を無効にします。

DeinterlaceParity

インターレース解除のフィールド パリティは、既定値は Auto です。

名前 説明
Auto

string

フィールドの順序を自動的に検出する

BottomFieldFirst

string

入力ビデオの下部フィールドの最初の処理を適用します。

TopFieldFirst

string

入力ビデオの先頭フィールドの最初の処理を適用します。

EncoderNamedPreset

ビデオのエンコードに使用する組み込みのプリセット。

名前 説明
AACGoodQualityAudio

string

192 kbps でエンコードされた AAC ステレオ オーディオのみを含む 1 つの MP4 ファイルを生成します。

AdaptiveStreaming

string

H.264 ビデオとステレオ AAC オーディオを使用して、GOP で整列された MP4 ファイルのセットを生成します。 入力解像度、ビットレート、フレーム レートに基づいてビットレート ラダーを自動生成します。 自動生成されたプリセットが、入力解像度を超えることはありません。 たとえば、入力が 720p の場合、出力は最大で 720p のままになります。

ContentAwareEncoding

string

コンテンツに対応したエンコードを使用して、GOP がアラインメントされた MP4 セットを生成します。 入力コンテンツを指定すると、サービスによって入力コンテンツに対する最初の簡単な分析が実行され、その結果を使用して、アダプティブ ストリーミングによる配信に最適なレイヤーの数、適切なビット レートと解像度の設定が決定されます。 このプリセットは、複雑さが低から中程度のビデオに特に有効です。つまり、ビット レートは低くなりますが、視聴者には快適なエクスペリエンスを提供できる品質を備えた出力ファイルということになります。 出力には、ビデオとオーディオがインターリーブされた MP4 ファイルが含まれるようになります。

ContentAwareEncodingExperimental

string

コンテンツ対応エンコード用の試験的なプリセットを公開します。 入力コンテンツを指定すると、サービスにより、アダプティブ ストリーミングによる配信に最適なレイヤーの数および適切なビット レートと解像度の設定の決定が、自動的に試みられます。 基になるアルゴリズムは、時間と共に進化を続けています。 出力には、ビデオとオーディオがインターリーブされた MP4 ファイルが含まれるようになります。

CopyAllBitrateNonInterleaved

string

入力アセットからすべてのビデオ ストリームとオーディオ ストリームを、インターリーブされないビデオおよびオーディオ出力ファイルとしてコピーします。 このプリセットを使用して、既存のアセットをクリップしたり、キー フレーム (GOP) 配列 MP4 ファイルのグループを、ストリーミング可能なアセットとして変換できます。

DDGoodQualityAudio

string

192 kbps でエンコードされた DD(Digital Dolby) ステレオ オーディオのみを含む 1 つの MP4 ファイルを生成します。

H264MultipleBitrate1080p

string

6000 kbps から 400 kbps までの 8 つの GOP アライン MP4 ファイルとステレオ AAC オーディオのセットを生成します。 解像度は 1080p から始まり、180p まで下がります。

H264MultipleBitrate720p

string

3400 kbps ~ 400 kbps の範囲の 6 つの GOP アライン MP4 ファイルとステレオ AAC オーディオのセットを生成します。 解像度は 720p から始まり、180p まで下がります。

H264MultipleBitrateSD

string

1900 kbps から 400 kbps までの 5 つの GOP アラインメント MP4 ファイルとステレオ AAC オーディオのセットを生成します。 解像度は 480p から始まり、240p まで下がります。

H264SingleBitrate1080p

string

ビデオが 6750 kbps の H.264 コーデックと 1080 ピクセルの画像の高さでエンコードされ、ステレオ オーディオが 128 kbps の AAC-LC コーデックでエンコードされる MP4 ファイルを生成します。

H264SingleBitrate720p

string

ビデオが 4500 kbps の H.264 コーデックと 720 ピクセルの画像の高さでエンコードされ、ステレオ オーディオが 128 kbps の AAC-LC コーデックでエンコードされる MP4 ファイルを生成します。

H264SingleBitrateSD

string

ビデオが H.264 コーデック (2200 kbps、画像の高さが 480 ピクセル) でエンコードされ、ステレオ オーディオが 128 kbps の AAC-LC コーデックでエンコードされる MP4 ファイルを生成します。

H265AdaptiveStreaming

string

H.265 ビデオとステレオ AAC オーディオを使用して、GOP 調整された MP4 ファイルのセットを作成します。 入力解像度、ビットレート、フレーム レートに基づいてビットレート ラダーを自動生成します。 自動生成されたプリセットが、入力解像度を超えることはありません。 たとえば、入力が 720p の場合、出力は最大で 720p のままになります。

H265ContentAwareEncoding

string

コンテンツに対応したエンコードを使用して、GOP がアラインメントされた MP4 セットを生成します。 入力コンテンツを指定すると、サービスによって入力コンテンツに対する最初の簡単な分析が実行され、その結果を使用して、アダプティブ ストリーミングによる配信に最適なレイヤーの数、適切なビット レートと解像度の設定が決定されます。 このプリセットは、複雑さが低から中程度のビデオに特に有効です。つまり、ビット レートは低くなりますが、視聴者には快適なエクスペリエンスを提供できる品質を備えた出力ファイルということになります。 出力には、ビデオとオーディオがインターリーブされた MP4 ファイルが含まれるようになります。

H265SingleBitrate1080p

string

ビデオが 3500 kbps の H.265 コーデックと 1080 ピクセルの画像の高さでエンコードされ、ステレオ オーディオが 128 kbps の AAC-LC コーデックでエンコードされる MP4 ファイルを生成します。

H265SingleBitrate4K

string

ビデオが H.265 コーデックで 9500 kbps、画像の高さが 2160 ピクセルでエンコードされ、ステレオ オーディオが 128 kbps の AAC-LC コーデックでエンコードされる MP4 ファイルを生成します。

H265SingleBitrate720p

string

ビデオが 1800 kbps の H.265 コーデックと 720 ピクセルの画像の高さでエンコードされ、ステレオ オーディオが 128 kbps の AAC-LC コーデックでエンコードされる MP4 ファイルを生成します。

EntropyMode

このレイヤーに使用するエントロピ モード。 指定しない場合、エンコーダーはプロファイルとレベルに適したモードを選択します。

名前 説明
Cabac

string

Context Adaptive Binary Arithmetic Coder (CABAC) エントロピ エンコード。

Cavlc

string

Context Adaptive Variable Length Coder (CAVLC) エントロピ エンコード。

ErrorAdditionalInfo

リソース管理エラーの追加情報。

名前 説明
info

object

追加情報。

type

string

追加情報の種類。

ErrorDetail

エラーの詳細。

名前 説明
additionalInfo

ErrorAdditionalInfo[]

エラーの追加情報。

code

string

エラー コード。

details

ErrorDetail[]

エラーの詳細です。

message

string

エラー メッセージ。

target

string

エラーのターゲット。

ErrorResponse

エラー応答

名前 説明
error

ErrorDetail

error オブジェクト。

FaceDetectorPreset

存在するすべての顔を検出 (および必要に応じて編集) するためにビデオを分析するときに使用されるすべての設定について説明します。

名前 説明
@odata.type string:

#Microsoft.Media.FaceDetectorPreset

派生型の識別子。

blurType

BlurType

ぼかしの種類

experimentalOptions

object

プリセット自体で公開されていないパラメーターのキー値ペアを含むディクショナリ

mode

FaceRedactorMode

このモードでは、1) 分析 - 検出専用の設定から選択できます。このモードでは、ビデオ全体で顔の外観をマークするメタデータ JSON ファイルが生成されます。可能であれば、同じ人物の外観に同じ ID が割り当てられます。2) 結合 - 検出された顔を編集 (ぼかし) します。 3) 編集 - これにより、2 パス プロセスが可能になり、検出された顔のサブセットの選択的なやり直しが可能になります。これは、以前の分析パスのメタデータ ファイルとソース ビデオ、およびユーザーが選択した ID のサブセット (編集が必要) を取り込みます。

resolution

AnalysisResolution

ビデオを分析する最大解像度を指定します。 既定の動作は "SourceResolution" です。これにより、分析時に入力ビデオが元の解像度で維持されます。 "StandardDefinition" を使用すると、適切な縦横比を維持しながら、入力ビデオのサイズが標準定義に変更されます。 ビデオの解像度が高い場合にのみサイズが変更されます。 たとえば、1920x1080 入力は処理前に 640x360 にスケーリングされます。 "StandardDefinition" に切り替えると、高解像度ビデオの処理にかかる時間が短縮されます。 また、このコンポーネントを使用するコストを削減することもできます (詳細については、を参照してください https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 ただし、サイズ変更されたビデオでは、最終的に小さすぎる顔が検出されない可能性があります。

FaceRedactorMode

このモードでは、1) 分析 - 検出専用の設定から選択できます。このモードでは、ビデオ全体で顔の外観をマークするメタデータ JSON ファイルが生成されます。可能な場合、同じ人物の外観には同じ ID が割り当てられます。2) 結合 - 検出された顔をさらに編集 (ぼかし) します。 3) 編集 - これにより、2 パス プロセスが可能になり、検出された顔のサブセットの選択的なやり直しが可能になります。メタデータ ファイルは、ソース ビデオと共に、以前の分析パスから取得され、ユーザーが選択した ID のサブセットを再処理する必要があります。

名前 説明
Analyze

string

分析モードでは、顔を検出し、結果を含むメタデータ ファイルを出力します。 顔が編集モードでぼやける前にメタデータ ファイルを編集できるようにします。

Combined

string

結合モードでは、解析された顔を編集する必要がない場合、1 回のパスで [分析] と [編集] の手順が実行されます。

Redact

string

編集モードでは、分析モードのメタデータ ファイルが使用され、検出された顔が編集されます。

Fade

入力メディアに適用されるフェード効果のプロパティについて説明します。

名前 説明
duration

string

ビデオのフェード効果の継続時間。 値は、ISO 8601 形式 (たとえば、5 秒間に色をフェードイン/アウトする PT05S)、フレーム数 (開始時刻から 10 フレームをフェードする場合は 10 など)、ストリームの継続時間に対する相対値 (ストリーム期間の 10% をフェードする場合は 10% など) です。

fadeColor

string

フェードイン/アウトの色。CSS レベル 1 の色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords または RGB/16 進値 (例: rgb(255,0,0)、0xFF0000、#FF0000

start

string

フェードを開始する位置からの入力ビデオ内の位置。 この値は、ISO 8601 形式 (たとえば、PT05S の場合は 5 秒で開始する)、フレーム数 (たとえば、10 の場合は 10 番目のフレームで開始する)、またはストリーム期間に対する相対値 (たとえば、10% の場合はストリーム期間の 10% で開始する) とすることができます。 既定値は 0 です

Filters

エンコード前に入力メディアに適用されるインターレース解除、回転など、すべてのフィルター処理操作について説明します。

名前 説明
crop

Rectangle

入力ビデオをトリミングする四角形ウィンドウのパラメーター。

deinterlace

Deinterlace

インターレース解除の設定。

fadeIn

Fade

入力メディアに適用されるフェード効果のプロパティについて説明します。

fadeOut

Fade

入力メディアに適用されるフェード効果のプロパティについて説明します。

overlays Overlay[]:

入力ビデオに適用されるオーバーレイのプロパティ。 これらは、オーディオ、画像、またはビデオオーバーレイです。

rotation

Rotation

エンコードされる前に、入力ビデオに適用される回転 (ある場合)。 既定値は Auto です

H264Complexity

エンコード設定を選択する方法をエンコーダーに指示します。 既定値は Balanced です。

名前 説明
Balanced

string

速度と品質のバランスを取る設定を使用するようにエンコーダーに指示します。

Quality

string

エンコード時間の短縮を犠牲にして高品質の出力を生成するように最適化された設定を使用するようにエンコーダーに指示します。

Speed

string

エンコードを高速化するために最適化された設定を使用するようにエンコーダーに指示します。 エンコード時間を短縮するために品質が犠牲になります。

H264Layer

H.264 ビデオ コーデックを使用して、入力ビデオを目的の出力ビットレート レイヤーにエンコードするときに使用する設定について説明します。

名前 説明
adaptiveBFrame

boolean

このレイヤーをエンコードするときにアダプティブ B フレームを使用するかどうか。 指定しない場合、ビデオ プロファイルで使用が許可されるたびにエンコーダーがオンになります。

bFrames

integer

このレイヤーをエンコードするときに使用する B フレームの数。 指定しない場合、エンコーダーはビデオ プロファイルとレベルに基づいて適切な数値を選択します。

bitrate

integer

このレイヤーの生成時に入力ビデオをエンコードする 1 秒あたりの平均ビットレート (ビット数)。 これは必須フィールドです。

bufferWindow

string

VBV バッファー ウィンドウの長さ。 値は ISO 8601 形式である必要があります。 値は[0.1-100]秒の範囲内である必要があります。 既定値は 5 秒 (PT5S など) です。

crf

number

このレイヤーをエンコードするときに使用する CRF の値。 この設定は、ビデオ コーデックの RateControlMode が CRF モードで設定されている場合に有効になります。 CRF 値の範囲は 0 ~ 51 で、値が小さいほど品質が向上し、ファイル サイズが大きくなります。 値を大きくすると圧縮率が高くなりますが、ある時点で品質が低下します。 既定値は 23 です。

entropyMode

EntropyMode

このレイヤーに使用するエントロピ モード。 指定しない場合、エンコーダーはプロファイルとレベルに適したモードを選択します。

frameRate

string

このレイヤーをエンコードするフレーム レート (1 秒あたりのフレーム数)。 値は M/N の形式で指定できます。M と N は整数 (たとえば、30000/1001)、または数値の形式 (30、29.97 など) です。 エンコーダーは、プロファイルとレベルに基づいて、許可されたフレーム レートに制約を適用します。 指定しない場合、エンコーダーは入力ビデオと同じフレーム レートを使用します。

height

string

このレイヤーの出力ビデオの高さ。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの高さが入力の半分のピクセル数を持つ場合を意味します。

label

string

このレイヤーの英数字ラベル。これは、異なるビデオレイヤーとオーディオレイヤーを多重化したり、出力ファイルに名前を付けたりするために使用できます。

level

string

現在、レベル 6.2 をサポートしています。 値には、Auto、または H.264 プロファイルに一致する数値を指定できます。 指定しない場合、既定値は Auto です。これにより、エンコーダーはこのレイヤーに適したレベルを選択できます。

maxBitrate

integer

VBV バッファーのリフィルを想定する最大ビットレート (1 秒あたりのビット数)。 指定しない場合、既定値はビットレートと同じ値になります。

profile

H264VideoProfile

現在、ベースライン、メイン、高、高 422、高 444 がサポートされています。 既定値は Auto です。

referenceFrames

integer

このレイヤーをエンコードするときに使用する参照フレームの数。 指定しない場合、エンコーダーはエンコーダーの複雑さの設定に基づいて適切な数値を決定します。

slices

integer

このレイヤーをエンコードするときに使用するスライスの数。 指定しない場合、既定値は 0 です。つまり、エンコーダーはフレームごとに 1 つのスライスを使用します。

width

string

このレイヤーの出力ビデオの幅。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの幅が入力の半分のピクセル数を意味します。

H264RateControlMode

ビデオレート制御モード

名前 説明
ABR

string

ターゲット ビットレートにヒットする平均ビットレート (ABR) モード: 既定のモード。

CBR

string

ターゲット ビットレートに関するビットレートのバリエーションを引き締める Constant Bitrate (CBR) モード。

CRF

string

一定の主観的品質を対象とする定数レート係数 (CRF) モード。

H264Video

H.264 コーデックを使用してビデオをエンコードするためのすべてのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.H264Video

派生型の識別子。

complexity

H264Complexity

エンコード設定を選択する方法をエンコーダーに指示します。 既定値は Balanced です。

keyFrameInterval

string

2 つのキー フレーム間の距離。 値は、ISO 8601 形式で指定された [0.5, 20] 秒の範囲で 0 以外にする必要があります。 既定値は 2 秒 (PT2S) です。 VideoSyncMode.Passthrough が設定されている場合、KeyFrameInterval 値が入力ソース設定に従う場合、この設定は無視されることに注意してください。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

layers

H264Layer[]

エンコーダーによって生成される出力 H.264 レイヤーのコレクション。

rateControlMode

H264RateControlMode

ビデオレート制御モード

sceneChangeDetection

boolean

エンコーダーがシーンの変更時にキー フレームを挿入する必要があるかどうか。 指定しない場合、既定値は false です。 このフラグは、エンコーダーが 1 つの出力ビデオを生成するように構成されている場合にのみ true に設定する必要があります。

stretchMode

StretchMode

サイズ変更モード - 目的の出力解像度に合わせて入力ビデオのサイズを変更する方法。 既定値は AutoSize です

syncMode

VideoSyncMode

ビデオ同期モード

H264VideoProfile

現在、ベースライン、メイン、高、高 422、高 444 がサポートされています。 既定値は Auto です。

名前 説明
Auto

string

適切な H.264 プロファイルを自動的に決定するようにエンコーダーに指示します。

Baseline

string

ベースライン プロファイル

High

string

高プロファイル。

High422

string

高 4:2:2 プロファイル。

High444

string

高い 4:4:4 予測プロファイル。

Main

string

メイン プロファイル

H265Complexity

エンコード設定を選択する方法をエンコーダーに指示します。 品質は、より高い圧縮率を提供しますが、コストが高く、コンピューティング時間が長くなります。 速度は比較的大きなファイルを生成しますが、高速で経済的です。 既定値は Balanced です。

名前 説明
Balanced

string

速度と品質のバランスを取る設定を使用するようにエンコーダーに指示します。

Quality

string

エンコード時間の短縮を犠牲にして高品質の出力を生成するように最適化された設定を使用するようにエンコーダーに指示します。

Speed

string

エンコードを高速化するために最適化された設定を使用するようにエンコーダーに指示します。 エンコード時間を短縮するために品質が犠牲になります。

H265Layer

H.265 ビデオ コーデックを使用して、入力ビデオを目的の出力ビットレート レイヤーにエンコードするときに使用する設定について説明します。

名前 説明
adaptiveBFrame

boolean

このレイヤーをエンコードするときにアダプティブ B フレームを使用するかどうかを指定します。 指定しない場合、ビデオ プロファイルで使用が許可されるたびにエンコーダーがオンになります。

bFrames

integer

このレイヤーをエンコードするときに使用する B フレームの数。 指定しない場合、エンコーダーはビデオ プロファイルとレベルに基づいて適切な数値を選択します。

bitrate

integer

このレイヤーの生成時に入力ビデオをエンコードする 1 秒あたりの平均ビットレート (ビット数)。 たとえば、3000Kbps または 3Mbps のターゲット ビットレートは、この値が 30000000 である必要があることを意味します。これは必須フィールドです。

bufferWindow

string

VBV バッファー ウィンドウの長さ。 値は ISO 8601 形式である必要があります。 値は[0.1-100]秒の範囲内である必要があります。 既定値は 5 秒 (PT5S など) です。

crf

number

このレイヤーをエンコードするときに使用する CRF の値。 この設定は、ビデオ コーデックの RateControlMode が CRF モードで設定されている場合に有効になります。 CRF 値の範囲は 0 ~ 51 で、値が小さいほど品質が向上し、ファイル サイズが大きくなります。 値を大きくすると圧縮率が高くなりますが、ある時点で品質が低下します。 既定値は 28 です。

frameRate

string

このレイヤーをエンコードするフレーム レート (1 秒あたりのフレーム数)。 値は M/N の形式で指定できます。M と N は整数 (たとえば、30000/1001)、または数値の形式 (30、29.97 など) です。 エンコーダーは、プロファイルとレベルに基づいて、許可されたフレーム レートに制約を適用します。 指定しない場合、エンコーダーは入力ビデオと同じフレーム レートを使用します。

height

string

このレイヤーの出力ビデオの高さ。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの高さが入力の半分のピクセル数を持つ場合を意味します。

label

string

このレイヤーの英数字ラベル。これは、異なるビデオレイヤーとオーディオレイヤーを多重化したり、出力ファイルに名前を付けたりするために使用できます。

level

string

現在、レベル 6.2 をサポートしています。 値には、Auto、または H.265 プロファイルに一致する数値を指定できます。 指定しない場合、既定値は Auto です。これにより、エンコーダーはこのレイヤーに適したレベルを選択できます。

maxBitrate

integer

VBV バッファーのリフィルを想定する最大ビットレート (1 秒あたりのビット数)。 指定しない場合、既定値はビットレートと同じ値になります。

profile

H265VideoProfile

現在、Main がサポートされています。 既定値は Auto です。

referenceFrames

integer

このレイヤーをエンコードするときに使用する参照フレームの数。 指定しない場合、エンコーダーはエンコーダーの複雑さの設定に基づいて適切な数値を決定します。

slices

integer

このレイヤーをエンコードするときに使用するスライスの数。 指定しない場合、既定値は 0 です。つまり、エンコーダーはフレームごとに 1 つのスライスを使用します。

width

string

このレイヤーの出力ビデオの幅。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの幅が入力の半分のピクセル数を意味します。

H265Video

H.265 コーデックを使用してビデオをエンコードするためのすべてのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.H265Video

派生型の識別子。

complexity

H265Complexity

エンコード設定を選択する方法をエンコーダーに指示します。 品質により、圧縮率が高くなりますが、コストが高くなり、コンピューティング時間が長くなります。 速度は比較的大きなファイルを生成しますが、より高速で経済的です。 既定値は Balanced です。

keyFrameInterval

string

2 つのキー フレーム間の距離。 値は、ISO 8601 形式で指定された [0.5, 20] 秒の範囲で 0 以外にする必要があります。 既定値は 2 秒 (PT2S) です。 VideoSyncMode.Passthrough が設定されている場合、KeyFrameInterval 値が入力ソース設定に従う場合、この設定は無視されることに注意してください。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

layers

H265Layer[]

エンコーダーによって生成される出力 H.265 レイヤーのコレクション。

sceneChangeDetection

boolean

エンコーダーがシーンの変更時にキー フレームを挿入するかどうかを指定します。 指定しない場合、既定値は false です。 このフラグは、エンコーダーが 1 つの出力ビデオを生成するように構成されている場合にのみ true に設定する必要があります。

stretchMode

StretchMode

サイズ変更モード - 目的の出力解像度に合わせて入力ビデオのサイズを変更する方法。 既定値は AutoSize です

syncMode

VideoSyncMode

ビデオ同期モード

H265VideoProfile

現在、Main がサポートされています。 既定値は Auto です。

名前 説明
Auto

string

適切な H.265 プロファイルを自動的に決定するようにエンコーダーに指示します。

Main

string

メイン プロファイル (https://x265.readthedocs.io/en/default/cli.html?highlight=profile#profile-level-tier)

Main10

string

Main 10 プロファイル (https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#Main_10)

Image

入力ビデオからサムネイルを生成するための基本的なプロパティについて説明します

名前 説明
@odata.type string:

#Microsoft.Media.Image

派生型の識別子。

keyFrameInterval

string

2 つのキー フレーム間の距離。 値は、ISO 8601 形式で指定された [0.5, 20] 秒の範囲で 0 以外にする必要があります。 既定値は 2 秒 (PT2S) です。 VideoSyncMode.Passthrough が設定されている場合、KeyFrameInterval 値が入力ソース設定に従う場合、この設定は無視されることに注意してください。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

range

string

サムネイルの生成を停止する入力ビデオの変換プリセット開始時刻に対する相対位置。 値は ISO 8601 形式で指定できます (たとえば、開始時刻から 5 分 30 秒で停止PT5M30S)、フレーム数 (たとえば、開始時刻から 300 番目のフレームで停止する場合は 300)。この値が 1 の場合は、開始時刻に 1 つのサムネイルのみを生成することを意味します。または、ストリームの継続時間に対する相対値 (たとえば、開始時刻からのストリーム継続時間の半分で停止する場合は 50%) を意味します。 既定値は 100% です。これは、ストリームの末尾で停止することを意味します。

start

string

サムネイルの生成を開始する場所からの入力ビデオ内の位置。 この値は、ISO 8601 形式 (たとえば、PT05S の場合は 5 秒で開始する)、フレーム数 (たとえば、10 の場合は 10 番目のフレームで開始する)、またはストリーム期間に対する相対値 (たとえば、10% の場合はストリーム期間の 10% で開始する) とすることができます。 また、マクロ {Best} もサポートされています。これにより、ビデオの最初の数秒から最適なサムネイルを選択するようにエンコーダーに指示が送られ、ステップと範囲の他の設定に関係なく、1 つのサムネイルのみが生成されることになります。 既定値はマクロ {Best} です。

step

string

サムネイルが生成される間隔。 値は、ISO 8601 形式 (たとえば、5 秒ごとに 1 つのイメージの PT05S)、フレーム数 (たとえば、30 フレームごとに 1 つのイメージの場合は 30)、またはストリームの継続時間に対する相対値 (たとえば、ストリーム期間の 10% ごとに 10% のイメージ) にすることができます。 注: ステップ値は、最初に生成されたサムネイルに影響します。これは、変換プリセットの開始時刻に指定されたサムネイルとは異なることがあります。 これはエンコーダーが原因で、開始時刻と開始時刻からのステップ位置の間の最適なサムネイルを最初の出力として選択しようとします。 既定値は 10% であるため、ストリームの期間が長い場合は、最初に生成されたサムネイルが、開始時に指定されたものから遠く離れている可能性があることを意味します。 最初のサムネイルが開始時刻に近いと予想される場合は [ステップ] に適切な値を選択するか、開始時に 1 つのサムネイルのみが必要な場合は Range 値を 1 に設定します。

stretchMode

StretchMode

サイズ変更モード - 目的の出力解像度に合わせて入力ビデオのサイズを変更する方法。 既定値は AutoSize です

syncMode

VideoSyncMode

ビデオ同期モード

ImageFormat

出力イメージ ファイルのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.ImageFormat

派生型の識別子。

filenamePattern

string

出力ファイルの作成に使用されるファイルの名前付けパターン。 ファイル名で次のマクロがサポートされています: {Basename} - 入力ビデオ ファイルの名前を使用する拡張マクロ。 入力ビデオ ファイルのベース名 (ファイル サフィックスが含まれていない) が 32 文字未満の場合は、入力ビデオ ファイルのベース名が使用されます。 入力ビデオ ファイルのベース名の長さが 32 文字を超える場合、基本名は合計で最初の 32 文字に切り捨てられます。 {Extension} - この形式に適した拡張機能。 {Label} - コーデック/レイヤーに割り当てられたラベル。 {Index} - サムネイルの一意のインデックス。 サムネイルにのみ適用されます。 {AudioStream} - 文字列 "Audio" とオーディオ ストリーム番号 (1 から始まる)。 {Bitrate} - オーディオ/ビデオ ビットレート (kbps 単位)。 サムネイルには適用されません。 {Codec} - オーディオ/ビデオ コーデックの種類。 {Resolution} - ビデオの解像度。 無置換のマクロはすべて折りたたまれて、ファイル名から削除されます。

InsightsType

サービスで生成する分析情報の種類を定義します。 使用できる値は、"AudioInsightsOnly"、"VideoInsightsOnly"、および "AllInsights" です。 既定値は AllInsights です。 これを AllInsights に設定し、入力がオーディオのみの場合は、オーディオ分析情報のみが生成されます。 同様に、入力がビデオのみの場合は、ビデオ分析情報のみが生成されます。 入力の一部がビデオのみであると予想される場合は、AudioInsightsOnly を使用しないことをお勧めします。または、入力の一部がオーディオのみであると予想される場合は、VideoInsightsOnly を使用します。 このような状態のジョブはエラーになります。

名前 説明
AllInsights

string

オーディオとビデオの両方の分析情報を生成します。 オーディオまたはビデオの分析情報が失敗した場合、失敗します。

AudioInsightsOnly

string

オーディオのみの分析情報を生成します。 ビデオが存在する場合でも無視します。 オーディオが存在しない場合は失敗します。

VideoInsightsOnly

string

ビデオのみの分析情報を生成します。 オーディオが存在する場合は無視します。 ビデオが存在しない場合は失敗します。

InterleaveOutput

オーディオとビデオをコンテナー形式で格納する方法を制御する出力のインターリーブ モードを設定します。 例: インターリーブ出力を NonInterleavedOutput に設定して、個別の MP4 ファイルでオーディオのみの出力とビデオのみの出力を生成します。

名前 説明
InterleavedOutput

string

出力には、オーディオとビデオの両方が含まれます。

NonInterleavedOutput

string

出力はビデオ専用またはオーディオ専用です。

JpgFormat

JPEG サムネイルを生成するための設定について説明します。

名前 説明
@odata.type string:

#Microsoft.Media.JpgFormat

派生型の識別子。

filenamePattern

string

出力ファイルの作成に使用されるファイルの名前付けパターン。 ファイル名で次のマクロがサポートされています: {Basename} - 入力ビデオ ファイルの名前を使用する拡張マクロ。 入力ビデオ ファイルのベース名 (ファイル サフィックスが含まれていない) が 32 文字未満の場合は、入力ビデオ ファイルのベース名が使用されます。 入力ビデオ ファイルのベース名の長さが 32 文字を超える場合、基本名は合計で最初の 32 文字に切り捨てられます。 {Extension} - この形式に適した拡張機能。 {Label} - コーデック/レイヤーに割り当てられたラベル。 {Index} - サムネイルの一意のインデックス。 サムネイルにのみ適用されます。 {AudioStream} - 文字列 "Audio" とオーディオ ストリーム番号 (1 から始まる)。 {Bitrate} - オーディオ/ビデオ ビットレート (kbps 単位)。 サムネイルには適用されません。 {Codec} - オーディオ/ビデオ コーデックの種類。 {Resolution} - ビデオの解像度。 無置換のマクロはすべて折りたたまれて、ファイル名から削除されます。

JpgImage

入力ビデオから一連の JPEG 画像を生成するためのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.JpgImage

派生型の識別子。

keyFrameInterval

string

2 つのキー フレーム間の距離。 値は、ISO 8601 形式で指定された [0.5, 20] 秒の範囲で 0 以外にする必要があります。 既定値は 2 秒 (PT2S) です。 VideoSyncMode.Passthrough が設定されている場合、KeyFrameInterval 値が入力ソース設定に従う場合、この設定は無視されることに注意してください。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

layers

JpgLayer[]

エンコーダーによって生成される出力 JPEG 画像レイヤーのコレクション。

range

string

サムネイルの生成を停止する入力ビデオの変換プリセット開始時刻に対する相対位置。 値は ISO 8601 形式で指定できます (たとえば、開始時刻から 5 分 30 秒で停止PT5M30S)、フレーム数 (たとえば、開始時刻から 300 番目のフレームで停止する場合は 300)。この値が 1 の場合は、開始時刻に 1 つのサムネイルのみを生成することを意味します。または、ストリームの継続時間に対する相対値 (たとえば、開始時刻からのストリーム継続時間の半分で停止する場合は 50%) を意味します。 既定値は 100% です。これは、ストリームの末尾で停止することを意味します。

spriteColumn

integer

サムネイル スプライト イメージで使用される列の数を設定します。 行数が自動的に計算され、スプライト内の各サムネイルの座標マッピングを使用して VTT ファイルが生成されます。 注: この値は正の整数にする必要があり、出力イメージの解像度が JPEG の最大ピクセル解像度制限 65535x65535 を超えないように、適切な値をお勧めします。

start

string

サムネイルの生成を開始する場所からの入力ビデオ内の位置。 この値は、ISO 8601 形式 (たとえば、PT05S の場合は 5 秒で開始する)、フレーム数 (たとえば、10 の場合は 10 番目のフレームで開始する)、またはストリーム期間に対する相対値 (たとえば、10% の場合はストリーム期間の 10% で開始する) とすることができます。 また、マクロ {Best} もサポートされています。これにより、ビデオの最初の数秒から最適なサムネイルを選択するようにエンコーダーに指示が送られ、ステップと範囲の他の設定に関係なく、1 つのサムネイルのみが生成されることになります。 既定値はマクロ {Best} です。

step

string

サムネイルが生成される間隔。 値は、ISO 8601 形式 (たとえば、5 秒ごとに 1 つのイメージの PT05S)、フレーム数 (たとえば、30 フレームごとに 1 つのイメージの場合は 30)、またはストリームの継続時間に対する相対値 (たとえば、ストリーム期間の 10% ごとに 10% のイメージ) にすることができます。 注: ステップ値は、最初に生成されたサムネイルに影響します。これは、変換プリセットの開始時刻に指定されたサムネイルとは異なることがあります。 これはエンコーダーが原因で、開始時刻と開始時刻からのステップ位置の間の最適なサムネイルを最初の出力として選択しようとします。 既定値は 10% であるため、ストリームの期間が長い場合は、最初に生成されたサムネイルが、開始時に指定されたものから遠く離れている可能性があることを意味します。 最初のサムネイルが開始時刻に近いと予想される場合は [ステップ] に適切な値を選択するか、開始時に 1 つのサムネイルのみが必要な場合は Range 値を 1 に設定します。

stretchMode

StretchMode

サイズ変更モード - 目的の出力解像度に合わせて入力ビデオのサイズを変更する方法。 既定値は AutoSize です

syncMode

VideoSyncMode

ビデオ同期モード

JpgLayer

入力ビデオから JPEG 画像を生成する設定について説明します。

名前 説明
height

string

このレイヤーの出力ビデオの高さ。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの高さが入力の半分のピクセル数を持つ場合を意味します。

label

string

このレイヤーの英数字ラベル。これは、異なるビデオレイヤーとオーディオレイヤーを多重化したり、出力ファイルに名前を付けたりするために使用できます。

quality

integer

JPEG 出力の圧縮品質。 範囲は 0 から 100 で、既定値は 70 です。

width

string

このレイヤーの出力ビデオの幅。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの幅が入力の半分のピクセル数を意味します。

Mp4Format

出力 ISO MP4 ファイルのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.Mp4Format

派生型の識別子。

filenamePattern

string

出力ファイルの作成に使用されるファイルの名前付けパターン。 ファイル名で次のマクロがサポートされています: {Basename} - 入力ビデオ ファイルの名前を使用する拡張マクロ。 入力ビデオ ファイルのベース名 (ファイル サフィックスが含まれていない) が 32 文字未満の場合は、入力ビデオ ファイルのベース名が使用されます。 入力ビデオ ファイルのベース名の長さが 32 文字を超える場合、基本名は合計で最初の 32 文字に切り捨てられます。 {Extension} - この形式に適した拡張機能。 {Label} - コーデック/レイヤーに割り当てられたラベル。 {Index} - サムネイルの一意のインデックス。 サムネイルにのみ適用されます。 {AudioStream} - 文字列 "Audio" とオーディオ ストリーム番号 (1 から始まる)。 {Bitrate} - オーディオ/ビデオ ビットレート (kbps 単位)。 サムネイルには適用されません。 {Codec} - オーディオ/ビデオ コーデックの種類。 {Resolution} - ビデオの解像度。 無置換のマクロはすべて折りたたまれて、ファイル名から削除されます。

outputFiles

OutputFile[]

生成する出力ファイルの一覧。 リスト内の各エントリは、一緒に多重化されるオーディオとビデオのレイヤー ラベルのセットです。

MultiBitrateFormat

GOP アラインマルチビットレート ファイルのコレクションを生成するためのプロパティについて説明します。 既定の動作では、すべてのオーディオと共に多重化されたビデオ レイヤーごとに 1 つの出力ファイルが生成されます。 生成される正確な出力ファイルは、outputFiles コレクションを指定することによって制御できます。

名前 説明
@odata.type string:

#Microsoft.Media.MultiBitrateFormat

派生型の識別子。

filenamePattern

string

出力ファイルの作成に使用されるファイルの名前付けパターン。 ファイル名で次のマクロがサポートされています: {Basename} - 入力ビデオ ファイルの名前を使用する拡張マクロ。 入力ビデオ ファイルのベース名 (ファイル サフィックスが含まれていない) が 32 文字未満の場合は、入力ビデオ ファイルのベース名が使用されます。 入力ビデオ ファイルのベース名の長さが 32 文字を超える場合、基本名は合計で最初の 32 文字に切り捨てられます。 {Extension} - この形式に適した拡張機能。 {Label} - コーデック/レイヤーに割り当てられたラベル。 {Index} - サムネイルの一意のインデックス。 サムネイルにのみ適用されます。 {AudioStream} - 文字列 "Audio" とオーディオ ストリーム番号 (1 から始まる)。 {Bitrate} - オーディオ/ビデオ ビットレート (kbps 単位)。 サムネイルには適用されません。 {Codec} - オーディオ/ビデオ コーデックの種類。 {Resolution} - ビデオの解像度。 無置換のマクロはすべて折りたたまれて、ファイル名から削除されます。

outputFiles

OutputFile[]

生成する出力ファイルの一覧。 リスト内の各エントリは、一緒に多重化されるオーディオとビデオのレイヤー ラベルのセットです。

OnErrorType

変換では、複数の出力を定義できます。 このプロパティは、1 つの出力が失敗した場合にサービスが実行する必要がある処理を定義します。他の出力の生成を続行するか、他の出力を停止します。 ジョブの全体的な状態には、"ContinueJob" で指定された出力のエラーは反映されません。 既定値は 'StopProcessingJob' です。

名前 説明
ContinueJob

string

この TransformOutput が失敗した場合は、他の TransformOutput を続行することをサービスに指示します。

StopProcessingJob

string

この TransformOutput が失敗した場合、その他の不完全な TransformOutput を停止できることをサービスに指示します。

OutputFile

生成された出力ファイルを表します。

名前 説明
labels

string[]

エンコーダーでビデオとオーディオを出力ファイルに多重化する方法を説明するラベルの一覧。 たとえば、エンコーダーがラベル v1 と v2 を持つ 2 つのビデオ レイヤーと、ラベル a1 を持つ 1 つのオーディオ レイヤーを生成している場合、'[v1, a1]' のような配列は、v1 で表されるビデオ トラックと a1 で表されるオーディオ トラックを含む出力ファイルを生成するようにエンコーダーに指示します。

PngFormat

PNG サムネイルを生成するための設定について説明します。

名前 説明
@odata.type string:

#Microsoft.Media.PngFormat

派生型の識別子。

filenamePattern

string

出力ファイルの作成に使用されるファイルの名前付けパターン。 ファイル名 {Basename} - 入力ビデオ ファイルの名前を使用する拡張マクロでは、次のマクロがサポートされています。 入力ビデオ ファイルのベース名 (ファイル サフィックスが含まれていない) の長さが 32 文字未満の場合は、入力ビデオ ファイルのベース名が使用されます。 入力ビデオ ファイルのベース名の長さが 32 文字を超える場合、基本名は合計長の最初の 32 文字に切り捨てられます。 {Extension} - この形式に適した拡張子。 {Label} - コーデック/レイヤーに割り当てられたラベル。 {Index} - サムネイルの一意のインデックス。 サムネイルにのみ適用されます。 {AudioStream} - 文字列 "Audio" とオーディオ ストリーム番号 (1 から開始)。 {Bitrate} - オーディオ/ビデオビットレート (kbps)。 サムネイルには適用されません。 {Codec} - オーディオ/ビデオ コーデックの種類。 {Resolution} - ビデオの解像度。 無置換のマクロはすべて折りたたまれて、ファイル名から削除されます。

PngImage

入力ビデオから一連の PNG 画像を生成するためのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.PngImage

派生型の識別子。

keyFrameInterval

string

2 つのキー フレーム間の距離。 値は、ISO 8601 形式で指定された [0.5, 20] 秒の範囲で 0 以外にする必要があります。 既定値は 2 秒 (PT2S) です。 VideoSyncMode.Passthrough が設定されている場合、KeyFrameInterval 値が入力ソース設定に従う場合、この設定は無視されることに注意してください。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

layers

PngLayer[]

エンコーダーによって生成される出力 PNG イメージ レイヤーのコレクション。

range

string

サムネイルの生成を停止する入力ビデオの変換プリセット開始時刻に対する相対位置。 値は ISO 8601 形式で指定できます (たとえば、開始時刻から 5 分 30 秒で停止PT5M30S)、フレーム数 (たとえば、開始時刻から 300 番目のフレームで停止する場合は 300)。この値が 1 の場合は、開始時刻に 1 つのサムネイルのみを生成することを意味します。または、ストリームの継続時間に対する相対値 (たとえば、開始時刻からのストリーム継続時間の半分で停止する場合は 50%) を意味します。 既定値は 100% です。これは、ストリームの末尾で停止することを意味します。

start

string

サムネイルの生成を開始する場所からの入力ビデオ内の位置。 この値は、ISO 8601 形式 (たとえば、PT05S の場合は 5 秒で開始する)、フレーム数 (たとえば、10 の場合は 10 番目のフレームで開始する)、またはストリーム期間に対する相対値 (たとえば、10% の場合はストリーム期間の 10% で開始する) とすることができます。 また、マクロ {Best} もサポートされています。これにより、ビデオの最初の数秒から最適なサムネイルを選択するようにエンコーダーに指示が送られ、ステップと範囲の他の設定に関係なく、1 つのサムネイルのみが生成されることになります。 既定値はマクロ {Best} です。

step

string

サムネイルが生成される間隔。 値は、ISO 8601 形式 (たとえば、5 秒ごとに 1 つのイメージの PT05S)、フレーム数 (たとえば、30 フレームごとに 1 つのイメージの場合は 30)、またはストリームの継続時間に対する相対値 (たとえば、ストリーム期間の 10% ごとに 10% のイメージ) にすることができます。 注: ステップ値は、最初に生成されたサムネイルに影響します。これは、変換プリセットの開始時刻に指定されたサムネイルとは異なることがあります。 これはエンコーダーが原因で、開始時刻と開始時刻からのステップ位置の間の最適なサムネイルを最初の出力として選択しようとします。 既定値は 10% であるため、ストリームの期間が長い場合は、最初に生成されたサムネイルが、開始時に指定されたものから遠く離れている可能性があることを意味します。 最初のサムネイルが開始時刻に近いと予想される場合は [ステップ] に適切な値を選択するか、開始時に 1 つのサムネイルのみが必要な場合は Range 値を 1 に設定します。

stretchMode

StretchMode

サイズ変更モード - 目的の出力解像度に合わせて入力ビデオのサイズを変更する方法。 既定値は AutoSize です

syncMode

VideoSyncMode

ビデオ同期モード

PngLayer

入力ビデオから PNG イメージを生成する設定について説明します。

名前 説明
height

string

このレイヤーの出力ビデオの高さ。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの高さが入力の半分のピクセル数を持つ場合を意味します。

label

string

このレイヤーの英数字ラベル。これは、異なるビデオレイヤーとオーディオレイヤーを多重化したり、出力ファイルに名前を付けたりするために使用できます。

width

string

このレイヤーの出力ビデオの幅。 この値には、絶対 (ピクセル単位) または相対値 (パーセンテージ) を指定できます。 たとえば、50% は、出力ビデオの幅が入力の半分のピクセル数を意味します。

PresetConfigurations

エンコーダーのオプションの構成設定のオブジェクト。

名前 説明
complexity

Complexity

エンコーダーの設定を構成して、速度と品質のバランスを制御できます。 例: [複雑さ] を [速度] に設定すると、エンコードが高速になりますが、圧縮効率は低下します。

interleaveOutput

InterleaveOutput

オーディオとビデオをコンテナー形式で格納する方法を制御する出力のインターリーブ モードを設定します。 例: インターリーブ出力を NonInterleavedOutput に設定して、個別の MP4 ファイルでオーディオのみの出力とビデオのみの出力を生成します。

keyFrameIntervalInSeconds

number

キー フレーム間隔 (秒単位)。 例: KeyFrameIntervalInSeconds を 2 に設定して、一部のプレーヤーの再生バッファリングを減らします。

maxBitrateBps

integer

最大ビットレート (1 秒あたりのビット数) (トップ ビデオ レイヤーのしきい値)。 例: MaxBitrateBps を 6000000 に設定して、複雑さが高いコンテンツに対して非常に高いビットレート出力が生成されないようにします。

maxHeight

integer

出力ビデオ レイヤーの最大高さ。 例: MaxHeight を 720 に設定して、入力が 4K であっても最大 720P の出力レイヤーを生成します。

maxLayers

integer

出力ビデオ レイヤーの最大数。 例: MaxLayers を 4 に設定して、エンコード ジョブの全体的なコストを制御するために、最大 4 つの出力レイヤーが生成されるようにします。

minBitrateBps

integer

ビット/秒の最小ビットレート (下のビデオ レイヤーのしきい値)。 例: MinBitrateBps を 200000 に設定して、ネットワーク帯域幅が低いユーザーを対象とする下位レイヤーを設定します。

minHeight

integer

出力ビデオ レイヤーの最小高さ。 例: MinHeight を 360 に設定して、180P のような小さな解像度の出力レイヤーを回避します。

Priority

Transform 内の TransformOutput の相対優先度を設定します。 これにより、TransformOutputs の処理にサービスで使用される優先順位が設定されます。 既定の優先度は Normal です。

名前 説明
High

string

他のユーザーよりも優先される TransformOutputs に使用されます。

Low

string

Normal および High priority TransformOutputs の後に生成できる TransformOutput に使用されます。

Normal

string

通常の優先度で生成できる TransformOutput に使用されます。

Rectangle

処理する前に、入力メディアに適用される四角形ウィンドウのプロパティについて説明します。

名前 説明
height

string

四角形領域の高さ (ピクセル単位)。 これは、絶対ピクセル値 (100 など) またはビデオのサイズに対する相対値 (たとえば、50%) です。

left

string

左余白からのピクセル数。 これは、絶対ピクセル値 (100 など) またはビデオのサイズに対する相対値 (たとえば、50%) です。

top

string

上余白からのピクセル数。 これは、絶対ピクセル値 (100 など) またはビデオのサイズに対する相対値 (たとえば、50%) です。

width

string

四角形領域の幅 (ピクセル単位)。 これは、絶対ピクセル値 (100 など) またはビデオのサイズに対する相対値 (たとえば、50%) です。

Rotation

エンコードされる前に、入力ビデオに適用される回転 (ある場合)。 既定値は Auto です

名前 説明
Auto

string

必要に応じて自動的に検出して回転します。

None

string

ビデオを回転させないでください。 出力形式でサポートされている場合、回転に関するメタデータはそのまま保持されます。

Rotate0

string

ビデオを回転せず、回転に関するメタデータを削除します。

Rotate180

string

時計回りに 180 度回転します。

Rotate270

string

時計回りに 270 度回転します。

Rotate90

string

時計回りに 90 度回転します。

StandardEncoderPreset

Standard Encoder を使用して入力ビデオをエンコードするときに使用されるすべての設定について説明します。

名前 説明
@odata.type string:

#Microsoft.Media.StandardEncoderPreset

派生型の識別子。

codecs Codec[]:

入力ビデオをエンコードするときに使用するコーデックの一覧。

experimentalOptions

object

プリセット自体で公開されていないパラメーターのキー値ペアを含むディクショナリ

filters

Filters

エンコードする前に入力メディアに適用される 1 つ以上のフィルター処理操作。

formats Format[]:

エンコーダーによって生成される出力の一覧。

StretchMode

サイズ変更モード - 入力ビデオを目的の出力解像度に合わせてサイズ変更する方法。 既定値は AutoSize です

名前 説明
AutoFit

string

出力のアクティブなビデオ領域の縦横比が入力と同じであることを確認しながら、出力の解像度を考慮して出力 (レターボックスまたは柱ボックス) を埋め込みます。 たとえば、入力が 1920x1080 で、エンコード プリセットが 1280x1280 を要求する場合、出力は 1280x1280 になり、縦横比が 16:9 の内側の四角形 1280x720、左右に 280 ピクセル幅の柱ボックス領域が含まれます。

AutoSize

string

出力解像度をオーバーライドし、埋め込みなしで入力の表示縦横比に合わせて変更します。 たとえば入力が 1920 x 1080 であるとき、エンコード プリセットによって 1280 x 1280 が要求された場合、プリセットの値がオーバーライドされ、出力は 1280 x 720 となり、入力の縦横比 (16:9) が維持されます。

None

string

入力ビデオのピクセルアスペクト比や表示アスペクト比を考慮せずに、出力解像度を厳密に尊重します。

systemData

リソースの作成と最後の変更に関連するメタデータ。

名前 説明
createdAt

string

リソース作成のタイムスタンプ (UTC)。

createdBy

string

リソースを作成した ID。

createdByType

createdByType

リソースを作成した ID の種類。

lastModifiedAt

string

リソースの最終変更のタイムスタンプ (UTC)

lastModifiedBy

string

リソースを最後に変更した ID。

lastModifiedByType

createdByType

リソースを最後に変更した ID の種類。

Transform

変換は、コード変換や分析情報の抽出など、入力メディアから目的の出力を生成するためのルールまたは命令をカプセル化します。 変換が作成されたら、ジョブを作成して入力メディアに適用できます。

名前 説明
id

string

リソースの完全修飾リソース ID。 例 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

name

string

リソースの名前

properties.created

string

変換の作成時の UTC 日時で、'YYYY-MM-DDThh:mm:ssZ' の形式です。

properties.description

string

変換の省略可能な詳細説明。

properties.lastModified

string

変換が最後に更新されたときの UTC 日時で、'YYYY-MM-DDThh:mm:ssZ' の形式です。

properties.outputs

TransformOutput[]

変換を生成する必要のある 1 つ以上の TransformOutput の配列。

systemData

systemData

このリソースに関連するシステム メタデータ。

type

string

リソースの型。 例: "Microsoft.Compute/virtualMachines" または "Microsoft.Storage/storageAccounts"

TransformOutput

TransformOutput のプロパティについて説明します。これは、目的の出力の生成時に適用される規則です。

名前 説明
onError

OnErrorType

変換では、複数の出力を定義できます。 このプロパティは、1 つの出力が失敗した場合にサービスが実行する必要がある処理を定義します。他の出力の生成を続行するか、他の出力を停止します。 ジョブの全体的な状態には、"ContinueJob" で指定された出力のエラーは反映されません。 既定値は 'StopProcessingJob' です。

preset Preset:

ソース ファイルから分析情報を変更、コード変換、または抽出して出力を生成するために使用される操作を記述するプリセット。

relativePriority

Priority

Transform 内の TransformOutput の相対優先度を設定します。 これにより、TransformOutputs の処理にサービスで使用される優先順位が設定されます。 既定の優先度は Normal です。

TransportStreamFormat

MPEG-2 トランスポート ストリーム (ISO/IEC 13818-1) 出力ビデオ ファイルを生成するためのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.TransportStreamFormat

派生型の識別子。

filenamePattern

string

出力ファイルの作成に使用されるファイルの名前付けパターン。 ファイル名で次のマクロがサポートされています: {Basename} - 入力ビデオ ファイルの名前を使用する拡張マクロ。 入力ビデオ ファイルのベース名 (ファイル サフィックスが含まれていない) が 32 文字未満の場合は、入力ビデオ ファイルのベース名が使用されます。 入力ビデオ ファイルのベース名の長さが 32 文字を超える場合、基本名は合計で最初の 32 文字に切り捨てられます。 {Extension} - この形式に適した拡張機能。 {Label} - コーデック/レイヤーに割り当てられたラベル。 {Index} - サムネイルの一意のインデックス。 サムネイルにのみ適用されます。 {AudioStream} - 文字列 "Audio" とオーディオ ストリーム番号 (1 から始まる)。 {Bitrate} - オーディオ/ビデオ ビットレート (kbps 単位)。 サムネイルには適用されません。 {Codec} - オーディオ/ビデオ コーデックの種類。 {Resolution} - ビデオの解像度。 無置換のマクロはすべて折りたたまれて、ファイル名から削除されます。

outputFiles

OutputFile[]

生成する出力ファイルの一覧。 リスト内の各エントリは、一緒に多重化されるオーディオとビデオのレイヤー ラベルのセットです。

Video

入力ビデオをエンコードするための基本的なプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.Video

派生型の識別子。

keyFrameInterval

string

2 つのキー フレーム間の距離。 値は、ISO 8601 形式で指定された [0.5, 20] 秒の範囲で 0 以外にする必要があります。 既定値は 2 秒 (PT2S) です。 VideoSyncMode.Passthrough が設定されている場合、KeyFrameInterval 値が入力ソース設定に従う場合、この設定は無視されることに注意してください。

label

string

コーデックの省略可能なラベル。 ラベルを使用して、多重化の動作を制御できます。

stretchMode

StretchMode

サイズ変更モード - 目的の出力解像度に合わせて入力ビデオのサイズを変更する方法。 既定値は AutoSize です

syncMode

VideoSyncMode

ビデオ同期モード

VideoAnalyzerPreset

オーディオとビデオの両方から分析情報 (豊富なメタデータ) を抽出し、JSON 形式ファイルを出力するビデオ アナライザー プリセット。

名前 説明
@odata.type string:

#Microsoft.Media.VideoAnalyzerPreset

派生型の識別子。

audioLanguage

string

BCP-47 形式の 'language tag-region' (例: 'en-US') を使用した入力内のオーディオ ペイロードの言語。 コンテンツの言語がわかっている場合は、指定することをお勧めします。 言語の自動検出は基本モードに含まれていないため、AudioAnalysisMode::Basic に対して言語を明示的に指定する必要があります。 言語が指定されていないか、null 値に設定されている場合、自動言語検出は、最初に検出された言語を選択し、ファイルの実行中、選択された言語で処理を行います。 現在、最初の言語が検出された後に複数の言語を動的に切り替えることはサポートされていません。 自動検出は、明確に識別可能な音声を使用したオーディオ録音に最適です。 自動検出で言語が見つからない場合、文字起こしは 'en-US' にフォールバックします。サポートされている言語の一覧については、こちらを参照してください。 https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions

object

プリセット自体で公開されていないパラメーターのキー値ペアを含むディクショナリ

insightsToExtract

InsightsType

サービスで生成する分析情報の種類を定義します。 使用できる値は、"AudioInsightsOnly"、"VideoInsightsOnly"、"AllInsights" です。 既定値は AllInsights です。 これを AllInsights に設定し、入力がオーディオのみの場合は、オーディオ分析情報のみが生成されます。 同様に、入力がビデオのみの場合は、ビデオ分析情報のみが生成されます。 入力の一部がビデオのみであることが予想される場合は、AudioInsightsOnly を使用しないことをお勧めします。または、入力の一部がオーディオのみであることが予想される場合は、VideoInsightsOnly を使用します。 このような状態のジョブはエラーになります。

mode

AudioAnalysisMode

実行するオーディオ分析操作のセットを決定します。 指定しない場合は、Standard AudioAnalysisMode が選択されます。

VideoOverlay

ビデオ オーバーレイのプロパティについて説明します。

名前 説明
@odata.type string:

#Microsoft.Media.VideoOverlay

派生型の識別子。

audioGainLevel

number

オーバーレイ内のオーディオのゲイン レベル。 値は [0, 1.0] の範囲内である必要があります。 既定値は 1.0 です。

cropRectangle

Rectangle

オーバーレイ画像またはビデオをトリミングするために使用するオプションの四角形ウィンドウ。

end

string

オーバーレイが終了する入力ビデオを参照する終了位置。 値は ISO 8601 形式である必要があります。 たとえば、PT30S は、入力ビデオに 30 秒でオーバーレイを終了します。 指定しない場合、または値が入力ビデオの継続時間より大きい場合は、オーバーレイメディアの継続時間が入力ビデオの継続時間よりも長い場合、オーバーレイは入力ビデオの終了まで適用されます。それ以外の場合、オーバーレイはオーバーレイメディアの継続時間と同じ長さになります。

fadeInDuration

string

オーバーレイが入力ビデオにフェードインする期間。 値は ISO 8601 期間形式である必要があります。 指定しない場合、既定の動作ではフェードインは行われません (PT0S と同じです)。

fadeOutDuration

string

オーバーレイが入力ビデオからフェードアウトする期間。 値は ISO 8601 期間形式である必要があります。 指定しない場合、既定の動作ではフェードアウトは行われません (PT0S と同じです)。

inputLabel

string

オーバーレイとして使用されるジョブ入力のラベル。 Input には、1 つのファイルを指定する必要があります。 JPG、PNG、GIF、または BMP 形式のイメージ ファイル、オーディオファイル (WAV、MP3、WMA、M4A ファイルなど)、またはビデオ ファイルを指定できます。 サポートされているオーディオとビデオのファイル形式の完全な一覧については、「」を参照してください https://aka.ms/mesformats

opacity

number

オーバーレイの不透明度。 これは、[0 - 1.0] の範囲内の値です。 既定値は 1.0 です。これは、オーバーレイが不透明であることを意味します。

position

Rectangle

オーバーレイが適用される入力ビデオ内の場所。

start

string

オーバーレイが開始される入力ビデオを参照する開始位置。 値は ISO 8601 形式である必要があります。 たとえば、PT05S は、入力ビデオに 5 秒でオーバーレイを開始します。 指定しない場合、オーバーレイは入力ビデオの先頭から開始されます。

VideoSyncMode

ビデオ同期モード

名前 説明
Auto

string

これが既定の方法です。 マルチプレクサーの機能に応じて、Cfr と Vfr のどちらかを選択します。 出力形式 MP4 の場合、既定のモードは Cfr です。

Cfr

string

入力フレームは、要求された一定のフレーム レートを正確に達成するために、必要に応じて繰り返しまたはドロップされます。 出力フレーム レートが指定した値で明示的に設定されている場合に推奨されます

Passthrough

string

フレームのプレゼンテーション タイムスタンプは、入力ファイルから出力ファイル ライターに渡されます。 入力ソースのフレーム レートが可変で、GOP 境界を揃えた出力でアダプティブ ストリーミング用に複数のレイヤーを生成しようとしている場合に推奨されます。 注: 入力内の 2 つ以上のフレームに重複するタイムスタンプがある場合、出力も同じ動作になります

Vfr

string

パススルー モードと同様ですが、入力に重複するタイムスタンプを持つフレームがある場合、1 つのフレームのみが出力に渡され、他のフレームは削除されます。 出力フレームの数が入力フレームの数と等しいと予想される場合に推奨されます。 たとえば、出力は、入力に対して PSNR などの品質メトリックを計算するために使用されます