Condividi tramite


Analyzer - Analyze Layout

Estrarre informazioni sul testo e sul layout da un determinato documento. Il documento di input deve essere di uno dei tipi di contenuto supportati: 'application/pdf', 'image/jpeg', 'image/png', 'image/tiff' o 'image/bmp'. In alternativa, usare il tipo 'application/json' per specificare il percorso (Uri o percorso locale) del documento da analizzare.

POST {endpoint}/formrecognizer/v2.1/layout/analyze
POST {endpoint}/formrecognizer/v2.1/layout/analyze?pages={pages}&language={language}&readingOrder={readingOrder}

Parametri dell'URI

Nome In Necessario Tipo Descrizione
endpoint
path True

string

Endpoint di Servizi cognitivi supportati (protocollo e nome host, ad esempio: https://westus2.api.cognitive.microsoft.com).

language
query

Language

Attualmente, solo Afrikaans ('af'), Albanese ('sq'), Squaren ('ast'), Basco ('eu'), Bislama ('bi'), Breton ('br'), Catalano ('ca'), Esegueano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Crimean Tartar - Latin script('crh'), Ceco ('ceb'), Ceco ('ceb'), 'cs'), Danese ('da'), Olandese ('nl'), Inglese ('en'), Estonian ('et'), Fijian ('fj'), Filippino ('fil'), Finlandese ('fi'), Francese ('fr'), English ('fur'), Galizian ('gl'), German ('de'), Gilbertese ('gil'), Groenlandia ('kl'), Haitian Creole ('ht'), Hani ('hni'), Hmong Daw ('mww'), Ungherese ('hu'), Indonesiano ('id'), Interlingua ('ia'), Inuktitut ('iu'), Irlandese ('ga'), Italiano ('it'), Giapponese ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kachin ('kac') ), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Curdo - alfabeto latino ('ku'), K'iche' ('quc'), lussemburghese ('lb'), Malese ('ms'), Manx ('gv'), Napoletano ('nap'), Norvegese ('no'), Occitan ('oc'), Polacco ('pl'), Portoghese ('pt'), Romancio ('rm'), Scots ('sco'), gaelico scozzese ('gd'), cinese semplificato ('zh-Hans'), sloveno ('sl'), spagnolo ('es'), swahili ('sw'), svedese ('sv'), alfabeto latino ('tt'), Tetum ('tet'), cinese tradizionale ('zh-Hant') Turco ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Ū ('za') e Zulu ('zu') sono supportati (stampa - settanta-tre lingue e scritto a mano - solo inglese). Il layout supporta l'identificazione automatica della lingua e i documenti in più lingue, quindi fornire solo un codice linguistico se si vuole forzare l'elaborazione documentata come tale lingua specifica.

pages
query

string[]

Numeri di pagina personalizzati per documenti a più pagine (PDF/TIFF), immettere il numero delle pagine che si desidera ottenere il risultato OCR. Per un intervallo di pagine, usare un trattino. Separare ogni pagina o intervallo con una virgola.

readingOrder
query

ReadingOrder

Algoritmo di lettura per ordinare le righe di testo restituite. Gli ordini di lettura supportati includono: basic(default), natural.

Intestazione della richiesta

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Nome Necessario Tipo Descrizione
Ocp-Apim-Subscription-Key True

string

Corpo della richiesta

Media Types: "application/pdf", "application/json", "image/jpeg", "image/png", "image/tiff", "image/bmp"

Nome Tipo Descrizione
source

string

Percorso origine file.

Risposte

Nome Tipo Descrizione
202 Accepted

La richiesta viene accodata correttamente.

Intestazioni

Operation-Location: string

Other Status Codes

ErrorResponse

Entità di risposta associata a risposte non riuscite contenenti dettagli aggiuntivi sull'errore.

Sicurezza

Ocp-Apim-Subscription-Key

Tipo: apiKey
In: header

Esempio

Analyze layout

Esempio di richiesta

POST {endpoint}/formrecognizer/v2.1/layout/analyze?language=en

Risposta di esempio

Operation-Location: {endpoint}/formrecognizer/v2.1/layout/analyzeResults/3b1e6c5b-e113-4114-ab6b-ce65dfe8050f

Definizioni

Nome Descrizione
ErrorInformation
ErrorResponse
Language

Attualmente, solo Afrikaans ('af'), Albanese ('sq'), Squaren ('ast'), Basco ('eu'), Bislama ('bi'), Breton ('br'), Catalano ('ca'), Esegueano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Crimean Tartar - Latin script('crh'), Ceco ('ceb'), Ceco ('ceb'), 'cs'), Danese ('da'), Olandese ('nl'), Inglese ('en'), Estonian ('et'), Fijian ('fj'), Filippino ('fil'), Finlandese ('fi'), Francese ('fr'), English ('fur'), Galizian ('gl'), German ('de'), Gilbertese ('gil'), Groenlandia ('kl'), Haitian Creole ('ht'), Hani ('hni'), Hmong Daw ('mww'), Ungherese ('hu'), Indonesiano ('id'), Interlingua ('ia'), Inuktitut ('iu'), Irlandese ('ga'), Italiano ('it'), Giapponese ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kachin ('kac') ), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Curdo - alfabeto latino ('ku'), K'iche' ('quc'), lussemburghese ('lb'), Malese ('ms'), Manx ('gv'), Napoletano ('nap'), Norvegese ('no'), Occitan ('oc'), Polacco ('pl'), Portoghese ('pt'), Romancio ('rm'), Scots ('sco'), gaelico scozzese ('gd'), cinese semplificato ('zh-Hans'), sloveno ('sl'), spagnolo ('es'), swahili ('sw'), svedese ('sv'), alfabeto latino ('tt'), Tetum ('tet'), cinese tradizionale ('zh-Hant') Turco ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Ū ('za') e Zulu ('zu') sono supportati (stampa - settanta-tre lingue e scritto a mano - solo inglese). Il layout supporta l'identificazione automatica della lingua e i documenti in più lingue, quindi fornire solo un codice linguistico se si vuole forzare l'elaborazione documentata come tale lingua specifica.

ReadingOrder

Algoritmo di lettura per ordinare le righe di testo restituite. Gli ordini di lettura supportati includono: basic(default), natural.

SourcePath

Uri o percorso locale per i dati di origine.

ErrorInformation

Nome Tipo Descrizione
code

string

message

string

ErrorResponse

Nome Tipo Descrizione
error

ErrorInformation

Language

Attualmente, solo Afrikaans ('af'), Albanese ('sq'), Squaren ('ast'), Basco ('eu'), Bislama ('bi'), Breton ('br'), Catalano ('ca'), Esegueano ('ceb'), Chamorro ('ch'), Cornish ('kw'), Corsican ('co'), Crimean Tartar - Latin script('crh'), Ceco ('ceb'), Ceco ('ceb'), 'cs'), Danese ('da'), Olandese ('nl'), Inglese ('en'), Estonian ('et'), Fijian ('fj'), Filippino ('fil'), Finlandese ('fi'), Francese ('fr'), English ('fur'), Galizian ('gl'), German ('de'), Gilbertese ('gil'), Groenlandia ('kl'), Haitian Creole ('ht'), Hani ('hni'), Hmong Daw ('mww'), Ungherese ('hu'), Indonesiano ('id'), Interlingua ('ia'), Inuktitut ('iu'), Irlandese ('ga'), Italiano ('it'), Giapponese ('ja'), Javanese ('jv'), Kabuverdianu ('kea'), Kachin ('kac'), Kachin ('kac') ), Kara-Kalpak ('kaa'), Kashubian ('csb'), Khasi ('kha'), Coreano ('ko'), Curdo - alfabeto latino ('ku'), K'iche' ('quc'), lussemburghese ('lb'), Malese ('ms'), Manx ('gv'), Napoletano ('nap'), Norvegese ('no'), Occitan ('oc'), Polacco ('pl'), Portoghese ('pt'), Romancio ('rm'), Scots ('sco'), gaelico scozzese ('gd'), cinese semplificato ('zh-Hans'), sloveno ('sl'), spagnolo ('es'), swahili ('sw'), svedese ('sv'), alfabeto latino ('tt'), Tetum ('tet'), cinese tradizionale ('zh-Hant') Turco ('tr'), Upper Sorbian ('hsb'), Uzbek ('uz'), Volapük ('vo'), Walser ('wae'), Western Frisian ('fy'), Yucatec Maya ('yua'), Ū ('za') e Zulu ('zu') sono supportati (stampa - settanta-tre lingue e scritto a mano - solo inglese). Il layout supporta l'identificazione automatica della lingua e i documenti in più lingue, quindi fornire solo un codice linguistico se si vuole forzare l'elaborazione documentata come tale lingua specifica.

Nome Tipo Descrizione
af

string

ast

string

bi

string

br

string

ca

string

ceb

string

ch

string

co

string

crh

string

cs

string

csb

string

da

string

de

string

en

string

es

string

et

string

eu

string

fi

string

fil

string

fj

string

fr

string

fur

string

fy

string

ga

string

gd

string

gil

string

gl

string

gv

string

hni

string

hsb

string

ht

string

hu

string

ia

string

id

string

it

string

iu

string

ja

string

jv

string

kaa

string

kac

string

kea

string

kha

string

kl

string

ko

string

ku

string

kw

string

lb

string

ms

string

mww

string

nap

string

nl

string

no

string

oc

string

pl

string

pt

string

quc

string

rm

string

sco

string

sl

string

sq

string

sv

string

sw

string

tet

string

tr

string

tt

string

uz

string

vo

string

wae

string

yua

string

za

string

zh-Hans

string

zh-Hant

string

zu

string

ReadingOrder

Algoritmo di lettura per ordinare le righe di testo restituite. Gli ordini di lettura supportati includono: basic(default), natural.

Nome Tipo Descrizione
basic

string

natural

string

SourcePath

Uri o percorso locale per i dati di origine.

Nome Tipo Descrizione
source

string

Percorso origine file.