Read API を使用する
Read OCR 機能を使用するには、ImageAnalysis 関数 (REST API または同等の SDK メソッド) を呼び出して、画像の URL またはバイナリ データを渡し、必要に応じて、性別に依存しないキャプションやテキストが書かれている言語を指定します (既定値は英語の en)。
ImageAnalysis に OCR 要求を行うには、ビジュアル機能を READ
として指定します。
C#
ImageAnalysisResult result = client.Analyze(
<image-to-analyze>,
VisualFeatures.Read);
Python
result = client.analyze(
image_url=<image_to_analyze>,
visual_features=[VisualFeatures.READ]
)
REST API を使用する場合は、機能を read
として指定します。
https://<endpoint>/computervision/imageanalysis:analyze?features=read&...
Read OCR 関数の結果は、JSON または類似の構造の言語固有のオブジェクトとして同期的に返されます。 これらの結果は、''ブロック'' (現在のサービスでは 1 つのブロックのみを使用) に分けられ、その後、''行''、''単語'' の順に分けられます。 さらに、テキスト値が "行" と "単語" の両方のレベルに含まれているので、個々の "単語" レベルでテキストを抽出する必要がない場合は、テキスト行全体を読み取りやすくなります。
{
"metadata":
{
"width": 500,
"height": 430
},
"readResult":
{
"blocks":
[
{
"lines":
[
{
"text": "Hello World!",
"boundingPolygon":
[
{"x":251,"y":265},
{"x":673,"y":260},
{"x":674,"y":308},
{"x":252,"y":318}
],
"words":
[
{
"text":"Hello",
"boundingPolygon":
[
{"x":252,"y":267},
{"x":307,"y":265},
{"x":307,"y":318},
{"x":253,"y":318}
],
"confidence":0.996
},
{
"text":"World!",
"boundingPolygon":
[
{"x":318,"y":264},
{"x":386,"y":263},
{"x":387,"y":316},
{"x":319,"y":318}
],
"confidence":0.99
}
]
},
]
}
]
}
}