Usar a API de leitura

3 minutos

Para usar o recurso Ler OCR, chame a função ImageAnalysis (API REST ou método SDK equivalente), passando a URL da imagem ou dados binários e, opcionalmente, especificando uma legenda neutra de gênero ou o idioma em que o texto está escrito (com um valor padrão de en para inglês).

Para fazer uma solicitação de OCR para ImageAnalysis, especifique o recurso visual como READ.

ImageAnalysisResult result = client.Analyze(
    <image-to-analyze>,
    VisualFeatures.Read);

Python

result = client.analyze(
    image_url=<image_to_analyze>,
    visual_features=[VisualFeatures.READ]
)

Se estiver usando a API REST, especifique o recurso como read.

https://<endpoint>/computervision/imageanalysis:analyze?features=read&...

Os resultados da função Read OCR são retornados de forma síncrona, como JSON ou como o objeto específico da linguagem de uma estrutura semelhante. Esses resultados são divididos em blocos (com o serviço atual usando apenas um bloco), depois linhas e palavras. Além disso, os valores de texto são incluídos nos níveis de linha e palavra, facilitando a leitura de linhas inteiras de texto se você não precisar extrair texto no nível de palavra individual.

{
    "metadata":
    {
        "width": 500,
        "height": 430
    },
    "readResult":
    {
        "blocks":
        [
            {
                "lines":
                [
                    {
                        "text": "Hello World!",
                        "boundingPolygon":
                        [
                            {"x":251,"y":265},
                            {"x":673,"y":260},
                            {"x":674,"y":308},
                            {"x":252,"y":318}
                        ],
                        "words":
                        [
                            {
                                "text":"Hello",
                                "boundingPolygon":
                                [
                                    {"x":252,"y":267},
                                    {"x":307,"y":265},
                                    {"x":307,"y":318},
                                    {"x":253,"y":318}
                                ],
                            "confidence":0.996
                            },
                            {
                                "text":"World!",
                                "boundingPolygon":
                                [
                                    {"x":318,"y":264},
                                    {"x":386,"y":263},
                                    {"x":387,"y":316},
                                    {"x":319,"y":318}
                                ],
                                "confidence":0.99
                            }
                        ]
                    },
                ]
            }
        ]
    }
}

Usar a API de leitura

Comentários