次の方法で共有


Image Analysis - Analyze Stream

入力イメージを分析します。 要求には、任意のコンテンツ タイプ ['image/*'、'application/octet-stream']、またはイメージ ストリームの取得に使用する url プロパティを含む JSON ペイロードが含まれています。

POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview
POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview

URI パラメーター

名前 / 必須 説明
api-version
query True

string

要求された API バージョン。

features
query

VisualFeature[]

要求されるビジュアル機能: タグ、オブジェクト、キャプション、denseCaptions、read、smartCrops、people。 パラメーター "model-name" が指定されていない場合は、このパラメーターを指定する必要があります。

gender-neutral-caption
query

boolean

キャプション機能と denseCaptions 機能に対して性別に依存しないキャプションを有効にするブール型フラグ。 このパラメーターを指定しない場合、既定値は "false" です。

language
query

string

出力生成に必要な言語。 このプロパティが指定されていない場合の既定値は "en" です。 サポートされている言語の一覧については、「」を参照してください https://aka.ms/cv-languages

model-name
query

string

カスタムトレーニング済みモデルの名前。 パラメーター "features" が指定されていない場合は、このパラメーターを指定する必要があります。

smartcrops-aspect-ratios
query

string

smartCrops 機能に使用する縦横比の一覧。 縦横比は、ターゲットのトリミング幅を高さで割ることによって計算されます。 サポートされている値は、0.75 から 1.8 (含む) の間です。 複数の値をコンマ区切りにする必要があります。 このパラメーターを指定しない場合、サービスは、縦横比が 0.5 ~ 2.0 (両端を含む) のトリミング候補を 1 つ返します。

要求本文

Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"

名前 説明
body

string

イメージ ストリーム。

応答

名前 説明
200 OK

ImageAnalysisResult

Success

Other Status Codes

ErrorResponse

エラー

ヘッダー

x-ms-error-code: string

AnalyzeImageFromImageStream_CustomModel

要求のサンプル

POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview

"Ynl0ZXM="

応答のサンプル

{
  "modelVersion": "2023-04-01-preview",
  "customModelResult": {
    "objectsResult": {
      "values": [
        {
          "id": "1",
          "boundingBox": {
            "x": 197,
            "y": 68,
            "w": 356,
            "h": 394
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.92431640625
            }
          ]
        },
        {
          "id": "2",
          "boundingBox": {
            "x": 0,
            "y": 77,
            "w": 241,
            "h": 359
          },
          "tags": [
            {
              "name": "class1",
              "confidence": 0.87890625
            }
          ]
        }
      ]
    }
  },
  "metadata": {
    "width": 660,
    "height": 495
  }
}

定義

名前 説明
AdultMatch

成人コンテンツの一致を記述する オブジェクト。

AdultResult

画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。

BoundingBox

画像内の領域の境界ボックス。

CaptionResult

画像が示す内容の簡単な説明。

CropRegion

スマート トリミング用に識別されたリージョン。 要求された縦横比ごとに 1 つのリージョンが返されます。

DenseCaption

画像が示す内容の簡単な説明。

DenseCaptionsResult

キャプションの一覧。

DetectedObject

画像内で検出されたオブジェクトについての説明。

DetectedPerson

画像内で検出された人物。

DocumentLine

単語や選択マークなどのコンテンツ要素の隣接するシーケンスで構成されるコンテンツ行オブジェクト。

DocumentPage

入力からページから抽出されたコンテンツ要素とレイアウト要素。

DocumentSpan

オフセットと長さとして指定された、連結されたコンテンツ プロパティの連続する領域。

DocumentStyle

観察されたテキスト スタイルを表す オブジェクト。

DocumentWord

連続する文字シーケンスで構成される単語オブジェクト。 中国語、日本語、韓国語などのスペース区切り以外の言語の場合、各文字は独自の単語として表されます。

ErrorResponse

エラーが発生したときに返される応答。

ErrorResponseDetails

エラー情報。

ErrorResponseInnerError

詳細なエラー。

ImageAnalysisResult

さまざまな種類の画像分析の組み合わせ結果について説明します。

ImageMetadataApiModel

高さや幅などの画像メタデータ情報。

ImagePredictionResult

画像の予測結果について説明します。

ObjectsResult

イメージ内で検出されたオブジェクトについて説明します。

PeopleResult

画像に人物が含まれているかどうかを示す オブジェクト。

ReadResult

読み取り操作の結果。

SmartCropsResult

スマート トリミングの結果。

Tag

画像内のエンティティ観察と信頼度スコア。

TagsResult

信頼度レベルを持つタグの一覧。

VisualFeature

要求されたビジュアル機能: タグ、オブジェクト、キャプション、denseCaptions、読み取り、smartCrops、people。 パラメーター "model-name" が指定されていない場合は、このパラメーターを指定する必要があります。

AdultMatch

成人コンテンツの一致を記述する オブジェクト。

名前 説明
confidence

number

一致する成人コンテンツの信頼度を示す値。

isMatch

boolean

画像が成人コンテンツと一致するかどうかを示す値。

AdultResult

画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。

名前 説明
adult

AdultMatch

成人コンテンツの一致を記述する オブジェクト。

gore

AdultMatch

成人コンテンツの一致を記述する オブジェクト。

racy

AdultMatch

成人コンテンツの一致を記述する オブジェクト。

BoundingBox

画像内の領域の境界ボックス。

名前 説明
h

integer

領域の左上の点から計測された高さ (ピクセル単位)。

w

integer

領域の左上の点から計測された幅 (ピクセル単位)。

x

integer

領域の左上の点の左座標 (ピクセル単位)。

y

integer

領域の左上の点の上座標 (ピクセル単位)。

CaptionResult

画像が示す内容の簡単な説明。

名前 説明
confidence

number

サービスがキャプションに持つ信頼度。

text

string

キャプションのテキスト。

CropRegion

スマート トリミング用に識別されたリージョン。 要求された縦横比ごとに 1 つのリージョンが返されます。

名前 説明
aspectRatio

number

トリミング領域の縦横比。

boundingBox

BoundingBox

画像内の領域の境界ボックス。

DenseCaption

画像が示す内容の簡単な説明。

名前 説明
boundingBox

BoundingBox

画像内の領域の境界ボックス。

confidence

number

サービスがキャプションに持つ信頼度。

text

string

キャプションのテキスト。

DenseCaptionsResult

キャプションの一覧。

名前 説明
values

DenseCaption[]

キャプションの一覧。

DetectedObject

画像内で検出されたオブジェクトについての説明。

名前 説明
boundingBox

BoundingBox

画像内の領域の境界ボックス。

id

string

検出されたオブジェクトの ID。

tags

Tag[]

検出されたオブジェクトの分類の信頼度。

DetectedPerson

画像内で検出された人物。

名前 説明
boundingBox

BoundingBox

画像内の領域の境界ボックス。

confidence

number

画像内の人物を観察したという信頼度スコアは、0から1の範囲の値として示される。

DocumentLine

単語や選択マークなどのコンテンツ要素の隣接するシーケンスで構成されるコンテンツ行オブジェクト。

名前 説明
boundingBox

number[]

線の境界ボックス。

content

string

読み取り順序で含まれる要素の連結されたコンテンツ。

spans

DocumentSpan[]

読み取り順序の連結されたコンテンツ内の行の場所。

DocumentPage

入力からページから抽出されたコンテンツ要素とレイアウト要素。

名前 説明
angle

number

時計回りの方向のコンテンツの一般的な向き(-180,180]の間の度数で測定されます。

height

number

画像/PDF の高さ (ピクセル/インチ単位)。

lines

DocumentLine[]

テキスト要素とビジュアル要素の両方を含む可能性がある、ページから抽出された行。

pageNumber

integer

入力ドキュメント内の 1 から始まるページ番号。

spans

DocumentSpan[]

読み取り順序の連結されたコンテンツ内のページの場所。

width

number

画像/PDF の幅をピクセル/インチ単位で指定します。

words

DocumentWord[]

ページから抽出された単語。

DocumentSpan

オフセットと長さとして指定された、連結されたコンテンツ プロパティの連続する領域。

名前 説明
length

integer

スパンで表されるコンテンツ内の文字数。

offset

integer

スパンで表されるコンテンツの 0 から始まるインデックス。

DocumentStyle

観察されたテキスト スタイルを表す オブジェクト。

名前 説明
confidence

number

スタイルを正しく識別する信頼度。

isHandwritten

boolean

コンテンツが手書きかどうか。

spans

DocumentSpan[]

スタイルが適用される連結コンテンツ内のテキスト要素の場所。

DocumentWord

連続する文字シーケンスで構成される単語オブジェクト。 中国語、日本語、韓国語などのスペース区切り以外の言語の場合、各文字は独自の単語として表されます。

名前 説明
boundingBox

number[]

単語の境界ボックス。

confidence

number

単語を正しく抽出する信頼度。

content

string

単語のテキスト コンテンツ。

span

DocumentSpan

オフセットと長さとして指定された、連結されたコンテンツ プロパティの連続した領域。

ErrorResponse

エラーが発生したときに返される応答。

名前 説明
error

ErrorResponseDetails

エラー情報。

ErrorResponseDetails

エラー情報。

名前 説明
code

string

エラー コード。

details

ErrorResponseDetails[]

詳細なエラーの一覧。

innererror

ErrorResponseInnerError

詳細なエラー。

message

string

エラー メッセージ。

target

string

エラーのターゲット。

ErrorResponseInnerError

詳細なエラー。

名前 説明
code

string

エラー コード。

innererror

ErrorResponseInnerError

詳細なエラー。

message

string

エラー メッセージ。

ImageAnalysisResult

さまざまな種類の画像分析の組み合わせ結果について説明します。

名前 説明
adultResult

AdultResult

画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。

captionResult

CaptionResult

画像が示す内容の簡単な説明。

customModelResult

ImagePredictionResult

画像の予測結果について説明します。

denseCaptionsResult

DenseCaptionsResult

キャプションの一覧。

metadata

ImageMetadataApiModel

高さや幅などの画像メタデータ情報。

modelVersion

string

モデル バージョン。

objectsResult

ObjectsResult

イメージ内で検出されたオブジェクトについて説明します。

peopleResult

PeopleResult

画像に人物が含まれているかどうかを示す オブジェクト。

readResult

ReadResult

読み取り操作の結果。

smartCropsResult

SmartCropsResult

スマート トリミングの結果。

tagsResult

TagsResult

信頼度レベルを持つタグの一覧。

ImageMetadataApiModel

高さや幅などの画像メタデータ情報。

名前 説明
height

integer

画像の高さ (ピクセル単位)。

width

integer

画像の幅 (ピクセル単位)。

ImagePredictionResult

画像の予測結果について説明します。

名前 説明
objectsResult

ObjectsResult

イメージ内で検出されたオブジェクトについて説明します。

tagsResult

TagsResult

信頼度レベルを持つタグの一覧。

ObjectsResult

イメージ内で検出されたオブジェクトについて説明します。

名前 説明
values

DetectedObject[]

検出されたオブジェクトの配列。

PeopleResult

画像に人物が含まれているかどうかを示す オブジェクト。

名前 説明
values

DetectedPerson[]

検出されたユーザーの配列。

ReadResult

読み取り操作の結果。

名前 説明
content

string

すべてのテキスト要素とビジュアル要素の文字列表現を読み取り順序で連結します。

pages

DocumentPage[]

分析されたページの一覧。

stringIndexType

string

文字列オフセットと長さの計算に使用されるメソッドには、'textElements'、'unicodeCodePoint'、'utf16CodeUnit' などがあります。

styles

DocumentStyle[]

抽出されたフォント スタイル。

SmartCropsResult

スマート トリミングの結果。

名前 説明
values

CropRegion[]

イメージをトリミングするための推奨リージョン。

Tag

画像内のエンティティ観察と信頼度スコア。

名前 説明
confidence

number

エンティティが観察された信頼度。

name

string

エンティティの名前。

TagsResult

信頼度レベルを持つタグの一覧。

名前 説明
values

Tag[]

信頼度レベルを持つタグの一覧。

VisualFeature

要求されたビジュアル機能: タグ、オブジェクト、キャプション、denseCaptions、読み取り、smartCrops、people。 パラメーター "model-name" が指定されていない場合は、このパラメーターを指定する必要があります。

名前 説明
caption

string

denseCaptions

string

objects

string

people

string

read

string

smartCrops

string

tags

string