Image Analysis - Analyze Stream

リファレンス

サービス:: Azure AI Services

API バージョン:: 2023-04-01-preview

入力イメージを分析します。要求には、任意のコンテンツタイプ ['image/*'、'application/octet-stream']、またはイメージストリームの取得に使用する url プロパティを含む JSON ペイロードが含まれています。

POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview

省略可能なパラメーターを含む:

POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview

URI パラメーター

名前	/	必須	型	説明
api-version	query	True	string	要求された API バージョン。
features	query		VisualFeature[]	要求されるビジュアル機能: タグ、オブジェクト、キャプション、denseCaptions、read、smartCrops、people。パラメーター "model-name" が指定されていない場合は、このパラメーターを指定する必要があります。
gender-neutral-caption	query		boolean	キャプション機能と denseCaptions 機能に対して性別に依存しないキャプションを有効にするブール型フラグ。このパラメーターを指定しない場合、既定値は "false" です。
language	query		string	出力生成に必要な言語。このプロパティが指定されていない場合の既定値は "en" です。サポートされている言語の一覧については、「」を参照してください https://aka.ms/cv-languages 。
model-name	query		string	カスタムトレーニング済みモデルの名前。パラメーター "features" が指定されていない場合は、このパラメーターを指定する必要があります。
smartcrops-aspect-ratios	query		string	smartCrops 機能に使用する縦横比の一覧。縦横比は、ターゲットのトリミング幅を高さで割ることによって計算されます。サポートされている値は、0.75 から 1.8 (含む) の間です。複数の値をコンマ区切りにする必要があります。このパラメーターを指定しない場合、サービスは、縦横比が 0.5 ~ 2.0 (両端を含む) のトリミング候補を 1 つ返します。

要求本文

Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"

名前	型	説明
body	string	イメージストリーム。

応答

名前	型	説明
200 OK	ImageAnalysisResult	Success
Other Status Codes	ErrorResponse	エラーヘッダー x-ms-error-code: string

名前

型

説明

200 OK

ImageAnalysisResult

Success

Other Status Codes

ErrorResponse

エラー

ヘッダー

x-ms-error-code: string

例

AnalyzeImageFromImageStream_CustomModel

要求のサンプル

HTTP

POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview

"Ynl0ZXM="

応答のサンプル

状態コード:: 200

{
  "modelVersion": "2023-04-01-preview",
  "customModelResult": {
    "objectsResult": {
      "values": [
        {
          "id": "1",
          "boundingBox": {
            "x": 197,
            "y": 68,
            "w": 356,
            "h": 394
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.92431640625
            }
          ]
        },
        {
          "id": "2",
          "boundingBox": {
            "x": 0,
            "y": 77,
            "w": 241,
            "h": 359
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.87890625
            }
          ]
        }
      ]
    }
  },
  "metadata": {
    "width": 660,
    "height": 495
  }
}

定義

名前	説明
AdultMatch	成人コンテンツの一致を記述するオブジェクト。
AdultResult	画像に成人向けコンテンツが含まれているか、わいせつであるかを示すオブジェクト。
BoundingBox	画像内の領域の境界ボックス。
CaptionResult	画像が示す内容の簡単な説明。
CropRegion	スマートトリミング用に識別されたリージョン。要求された縦横比ごとに 1 つのリージョンが返されます。
DenseCaption	画像が示す内容の簡単な説明。
DenseCaptionsResult	キャプションの一覧。
DetectedObject	画像内で検出されたオブジェクトについての説明。
DetectedPerson	画像内で検出された人物。
DocumentLine	単語や選択マークなどのコンテンツ要素の隣接するシーケンスで構成されるコンテンツ行オブジェクト。
DocumentPage	入力からページから抽出されたコンテンツ要素とレイアウト要素。
DocumentSpan	オフセットと長さとして指定された、連結されたコンテンツプロパティの連続する領域。
DocumentStyle	観察されたテキストスタイルを表すオブジェクト。
DocumentWord	連続する文字シーケンスで構成される単語オブジェクト。中国語、日本語、韓国語などのスペース区切り以外の言語の場合、各文字は独自の単語として表されます。
ErrorResponse	エラーが発生したときに返される応答。
ErrorResponseDetails	エラー情報。
ErrorResponseInnerError	詳細なエラー。
ImageAnalysisResult	さまざまな種類の画像分析の組み合わせ結果について説明します。
ImageMetadataApiModel	高さや幅などの画像メタデータ情報。
ImagePredictionResult	画像の予測結果について説明します。
ObjectsResult	イメージ内で検出されたオブジェクトについて説明します。
PeopleResult	画像に人物が含まれているかどうかを示すオブジェクト。
ReadResult	読み取り操作の結果。
SmartCropsResult	スマートトリミングの結果。
Tag	画像内のエンティティ観察と信頼度スコア。
TagsResult	信頼度レベルを持つタグの一覧。
VisualFeature	要求されたビジュアル機能: タグ、オブジェクト、キャプション、denseCaptions、読み取り、smartCrops、people。パラメーター "model-name" が指定されていない場合は、このパラメーターを指定する必要があります。

AdultMatch

成人コンテンツの一致を記述するオブジェクト。

名前	型	説明
confidence	number	一致する成人コンテンツの信頼度を示す値。
isMatch	boolean	画像が成人コンテンツと一致するかどうかを示す値。

AdultResult

画像に成人向けコンテンツが含まれているか、わいせつであるかを示すオブジェクト。

名前	型	説明
adult	AdultMatch	成人コンテンツの一致を記述するオブジェクト。
gore	AdultMatch	成人コンテンツの一致を記述するオブジェクト。
racy	AdultMatch	成人コンテンツの一致を記述するオブジェクト。

BoundingBox

画像内の領域の境界ボックス。

名前	型	説明
h	integer	領域の左上の点から計測された高さ (ピクセル単位)。
w	integer	領域の左上の点から計測された幅 (ピクセル単位)。
x	integer	領域の左上の点の左座標 (ピクセル単位)。
y	integer	領域の左上の点の上座標 (ピクセル単位)。

CaptionResult

画像が示す内容の簡単な説明。

名前	型	説明
confidence	number	サービスがキャプションに持つ信頼度。
text	string	キャプションのテキスト。

CropRegion

スマートトリミング用に識別されたリージョン。要求された縦横比ごとに 1 つのリージョンが返されます。

名前	型	説明
aspectRatio	number	トリミング領域の縦横比。
boundingBox	BoundingBox	画像内の領域の境界ボックス。

DenseCaption

画像が示す内容の簡単な説明。

名前	型	説明
boundingBox	BoundingBox	画像内の領域の境界ボックス。
confidence	number	サービスがキャプションに持つ信頼度。
text	string	キャプションのテキスト。

DenseCaptionsResult

キャプションの一覧。

名前	型	説明
values	DenseCaption[]	キャプションの一覧。

DetectedObject

画像内で検出されたオブジェクトについての説明。

名前	型	説明
boundingBox	BoundingBox	画像内の領域の境界ボックス。
id	string	検出されたオブジェクトの ID。
tags	Tag[]	検出されたオブジェクトの分類の信頼度。

DetectedPerson

画像内で検出された人物。

名前	型	説明
boundingBox	BoundingBox	画像内の領域の境界ボックス。
confidence	number	画像内の人物を観察したという信頼度スコアは、0から1の範囲の値として示される。

DocumentLine

単語や選択マークなどのコンテンツ要素の隣接するシーケンスで構成されるコンテンツ行オブジェクト。

名前	型	説明
boundingBox	number[]	線の境界ボックス。
content	string	読み取り順序で含まれる要素の連結されたコンテンツ。
spans	DocumentSpan[]	読み取り順序の連結されたコンテンツ内の行の場所。

DocumentPage

入力からページから抽出されたコンテンツ要素とレイアウト要素。

名前	型	説明
angle	number	時計回りの方向のコンテンツの一般的な向き(-180,180]の間の度数で測定されます。
height	number	画像/PDF の高さ (ピクセル/インチ単位)。
lines	DocumentLine[]	テキスト要素とビジュアル要素の両方を含む可能性がある、ページから抽出された行。
pageNumber	integer	入力ドキュメント内の 1 から始まるページ番号。
spans	DocumentSpan[]	読み取り順序の連結されたコンテンツ内のページの場所。
width	number	画像/PDF の幅をピクセル/インチ単位で指定します。
words	DocumentWord[]	ページから抽出された単語。

DocumentSpan

オフセットと長さとして指定された、連結されたコンテンツプロパティの連続する領域。

名前	型	説明
length	integer	スパンで表されるコンテンツ内の文字数。
offset	integer	スパンで表されるコンテンツの 0 から始まるインデックス。

DocumentStyle

観察されたテキストスタイルを表すオブジェクト。

名前	型	説明
confidence	number	スタイルを正しく識別する信頼度。
isHandwritten	boolean	コンテンツが手書きかどうか。
spans	DocumentSpan[]	スタイルが適用される連結コンテンツ内のテキスト要素の場所。

DocumentWord

連続する文字シーケンスで構成される単語オブジェクト。中国語、日本語、韓国語などのスペース区切り以外の言語の場合、各文字は独自の単語として表されます。

名前	型	説明
boundingBox	number[]	単語の境界ボックス。
confidence	number	単語を正しく抽出する信頼度。
content	string	単語のテキストコンテンツ。
span	DocumentSpan	オフセットと長さとして指定された、連結されたコンテンツプロパティの連続した領域。

ErrorResponse

エラーが発生したときに返される応答。

名前	型	説明
error	ErrorResponseDetails	エラー情報。

ErrorResponseDetails

エラー情報。

名前	型	説明
code	string	エラーコード。
details	ErrorResponseDetails[]	詳細なエラーの一覧。
innererror	ErrorResponseInnerError	詳細なエラー。
message	string	エラーメッセージ。
target	string	エラーのターゲット。

ErrorResponseInnerError

詳細なエラー。

名前	型	説明
code	string	エラーコード。
innererror	ErrorResponseInnerError	詳細なエラー。
message	string	エラーメッセージ。

ImageAnalysisResult

さまざまな種類の画像分析の組み合わせ結果について説明します。

名前	型	説明
adultResult	AdultResult	画像に成人向けコンテンツが含まれているか、わいせつであるかを示すオブジェクト。
captionResult	CaptionResult	画像が示す内容の簡単な説明。
customModelResult	ImagePredictionResult	画像の予測結果について説明します。
denseCaptionsResult	DenseCaptionsResult	キャプションの一覧。
metadata	ImageMetadataApiModel	高さや幅などの画像メタデータ情報。
modelVersion	string	モデルバージョン。
objectsResult	ObjectsResult	イメージ内で検出されたオブジェクトについて説明します。
peopleResult	PeopleResult	画像に人物が含まれているかどうかを示すオブジェクト。
readResult	ReadResult	読み取り操作の結果。
smartCropsResult	SmartCropsResult	スマートトリミングの結果。
tagsResult	TagsResult	信頼度レベルを持つタグの一覧。

ImageMetadataApiModel

高さや幅などの画像メタデータ情報。

名前	型	説明
height	integer	画像の高さ (ピクセル単位)。
width	integer	画像の幅 (ピクセル単位)。

ImagePredictionResult

画像の予測結果について説明します。

名前	型	説明
objectsResult	ObjectsResult	イメージ内で検出されたオブジェクトについて説明します。
tagsResult	TagsResult	信頼度レベルを持つタグの一覧。

ObjectsResult

イメージ内で検出されたオブジェクトについて説明します。

名前	型	説明
values	DetectedObject[]	検出されたオブジェクトの配列。

PeopleResult

画像に人物が含まれているかどうかを示すオブジェクト。

名前	型	説明
values	DetectedPerson[]	検出されたユーザーの配列。

ReadResult

読み取り操作の結果。

名前	型	説明
content	string	すべてのテキスト要素とビジュアル要素の文字列表現を読み取り順序で連結します。
pages	DocumentPage[]	分析されたページの一覧。
stringIndexType	string	文字列オフセットと長さの計算に使用されるメソッドには、'textElements'、'unicodeCodePoint'、'utf16CodeUnit' などがあります。
styles	DocumentStyle[]	抽出されたフォントスタイル。

SmartCropsResult

スマートトリミングの結果。

名前	型	説明
values	CropRegion[]	イメージをトリミングするための推奨リージョン。

Tag

画像内のエンティティ観察と信頼度スコア。

名前	型	説明
confidence	number	エンティティが観察された信頼度。
name	string	エンティティの名前。

TagsResult

信頼度レベルを持つタグの一覧。

名前	型	説明
values	Tag[]	信頼度レベルを持つタグの一覧。

VisualFeature

要求されたビジュアル機能: タグ、オブジェクト、キャプション、denseCaptions、読み取り、smartCrops、people。パラメーター "model-name" が指定されていない場合は、このパラメーターを指定する必要があります。

名前	型	説明
caption	string
denseCaptions	string
objects	string
people	string
read	string
smartCrops	string
tags	string

次の方法で共有

Image Analysis - Analyze Stream

URI パラメーター

要求本文

応答

例

AnalyzeImageFromImageStream_CustomModel

要求のサンプル

応答のサンプル

定義

AdultMatch

AdultResult

BoundingBox

CaptionResult

CropRegion

DenseCaption

DenseCaptionsResult

DetectedObject

DetectedPerson

DocumentLine

DocumentPage

DocumentSpan

DocumentStyle

DocumentWord

ErrorResponse

ErrorResponseDetails

ErrorResponseInnerError

ImageAnalysisResult

ImageMetadataApiModel

ImagePredictionResult

ObjectsResult

PeopleResult

ReadResult

SmartCropsResult

Tag

TagsResult

VisualFeature

その他のリソース