Condividi tramite


Document Models - Analyze Batch Documents

Analizza i documenti batch con il modello di documento.

POST {endpoint}/documentintelligence/documentModels/{modelId}:analyzeBatch?api-version=2024-11-30
POST {endpoint}/documentintelligence/documentModels/{modelId}:analyzeBatch?api-version=2024-11-30&pages={pages}&locale={locale}&stringIndexType={stringIndexType}&features={features}&queryFields={queryFields}&outputContentFormat={outputContentFormat}&output={output}

Parametri dell'URI

Nome In Necessario Tipo Descrizione
endpoint
path True

string

uri

Endpoint del servizio Document Intelligence.

modelId
path True

string

Nome univoco del modello di documento.

Criterio di espressione regolare: ^[a-zA-Z0-9][a-zA-Z0-9._~-]{1,63}$

api-version
query True

string

Versione dell'API da usare per questa operazione.

features
query

DocumentAnalysisFeature[]

Elenco delle funzionalità di analisi facoltative.

locale
query

string

Hint per le impostazioni locali per il riconoscimento del testo e l'analisi dei documenti. Il valore può contenere solo il codice di lingua (ad esempio "en", "fr") o il tag di lingua BCP 47 (ad esempio "en-US").

output
query

AnalyzeOutputOption[]

Output aggiuntivi da generare durante l'analisi.

outputContentFormat
query

DocumentContentFormat

Formato del contenuto principale del risultato di analisi.

pages
query

string

Numeri di pagina basati su 1 da analizzare. Ex. "1-3,5,7-9"

Criterio di espressione regolare: ^(\d+(-\d+)?)(,\s*(\d+(-\d+)?))*$

queryFields
query

string[]

Elenco di campi aggiuntivi da estrarre. Ex. "NumberOfGuests,StoreNumber"

stringIndexType
query

StringIndexType

Metodo utilizzato per calcolare l'offset e la lunghezza delle stringhe.

Corpo della richiesta

Nome Necessario Tipo Descrizione
resultContainerUrl True

string

URL del contenitore di Archiviazione BLOB di Azure in cui verranno archiviati i file dei risultati di analisi.

azureBlobFileListSource

AzureBlobFileListContentSource

Elenco di file di Archiviazione BLOB di Azure che specifica i documenti batch. È necessario specificare azureBlobSource o azureBlobFileListSource.

azureBlobSource

AzureBlobContentSource

Percorso di Archiviazione BLOB di Azure contenente i documenti batch. È necessario specificare azureBlobSource o azureBlobFileListSource.

overwriteExisting

boolean

Sovrascrivere i file dei risultati di analisi esistenti?

resultPrefix

string

Prefisso del nome BLOB dei file di risultati.

Risposte

Nome Tipo Descrizione
202 Accepted

La richiesta è stata accettata per l'elaborazione, ma l'elaborazione non è ancora stata completata.

Intestazioni

  • Operation-Location: string
  • Retry-After: integer
Other Status Codes

DocumentIntelligenceErrorResponse

Risposta di errore imprevista.

Sicurezza

Ocp-Apim-Subscription-Key

Tipo: apiKey
In: header

OAuth2Auth

Tipo: oauth2
Flow: accessCode
URL di autorizzazione: https://login.microsoftonline.com/common/oauth2/authorize
URL token: https://login.microsoftonline.com/common/oauth2/token

Ambiti

Nome Descrizione
https://cognitiveservices.azure.com/.default

Esempio

Analyze Batch Documents

Esempio di richiesta

POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel:analyzeBatch?api-version=2024-11-30&pages=1-5&locale=en-US&stringIndexType=textElements

{
  "azureBlobSource": {
    "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
    "prefix": "trainingDocs/"
  },
  "resultContainerUrl": "https://myStorageAccount.blob.core.windows.net/myOutputContainer?mySasToken",
  "resultPrefix": "trainingDocsResult/",
  "overwriteExisting": true
}

Risposta di esempio

Operation-Location: https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentModels/customModel/analyzeBatchResults/3b31320d-8bab-4f88-b19c-2322a7f11034?api-version=2024-02-29-preview

Definizioni

Nome Descrizione
AnalyzeBatchDocumentsRequest

Parametri di analisi dei documenti batch.

AnalyzeOutputOption

Output aggiuntivi da generare durante l'analisi.

AzureBlobContentSource

Contenuto di Archiviazione BLOB di Azure.

AzureBlobFileListContentSource

Elenco di file in Archiviazione BLOB di Azure.

DocumentAnalysisFeature

Funzionalità di analisi dei documenti da abilitare.

DocumentContentFormat

Formato del contenuto nel risultato analizzato.

DocumentIntelligenceError

Oggetto error.

DocumentIntelligenceErrorResponse

Oggetto risposta di errore.

DocumentIntelligenceInnerError

Oggetto contenente informazioni più specifiche sull'errore.

StringIndexType

Metodo utilizzato per calcolare l'offset e la lunghezza delle stringhe.

AnalyzeBatchDocumentsRequest

Parametri di analisi dei documenti batch.

Nome Tipo Valore predefinito Descrizione
azureBlobFileListSource

AzureBlobFileListContentSource

Elenco di file di Archiviazione BLOB di Azure che specifica i documenti batch. È necessario specificare azureBlobSource o azureBlobFileListSource.

azureBlobSource

AzureBlobContentSource

Percorso di Archiviazione BLOB di Azure contenente i documenti batch. È necessario specificare azureBlobSource o azureBlobFileListSource.

overwriteExisting

boolean

False

Sovrascrivere i file dei risultati di analisi esistenti?

resultContainerUrl

string

URL del contenitore di Archiviazione BLOB di Azure in cui verranno archiviati i file dei risultati di analisi.

resultPrefix

string

Prefisso del nome BLOB dei file di risultati.

AnalyzeOutputOption

Output aggiuntivi da generare durante l'analisi.

Nome Tipo Descrizione
figures

string

Generare immagini ritagliate di figure rilevate.

pdf

string

Generare un output PDF ricercabile.

AzureBlobContentSource

Contenuto di Archiviazione BLOB di Azure.

Nome Tipo Descrizione
containerUrl

string

URL del contenitore di Archiviazione BLOB di Azure.

prefix

string

Prefisso del nome BLOB.

AzureBlobFileListContentSource

Elenco di file in Archiviazione BLOB di Azure.

Nome Tipo Descrizione
containerUrl

string

URL del contenitore di Archiviazione BLOB di Azure.

fileList

string

Percorso di un file JSONL all'interno del contenitore che specifica un subset di documenti.

DocumentAnalysisFeature

Funzionalità di analisi dei documenti da abilitare.

Nome Tipo Descrizione
barcodes

string

Abilitare il rilevamento dei codici a barre nel documento.

formulas

string

Abilitare il rilevamento delle espressioni matematiche nel documento.

keyValuePairs

string

Abilitare il rilevamento delle coppie chiave-valore generale (campi modulo) nel documento.

languages

string

Abilitare il rilevamento della lingua del contenuto del testo.

ocrHighResolution

string

Eseguire OCR con una risoluzione superiore per gestire i documenti con stampa fine.

queryFields

string

Abilitare l'estrazione di campi aggiuntivi tramite il parametro di query QueryFields.

styleFont

string

Abilitare il riconoscimento di vari stili di carattere.

DocumentContentFormat

Formato del contenuto nel risultato analizzato.

Nome Tipo Descrizione
markdown

string

Rappresentazione markdown del contenuto del documento con intestazioni di sezione, tabelle e così via.

text

string

Rappresentazione in testo normale del contenuto del documento senza formattazione.

DocumentIntelligenceError

Oggetto error.

Nome Tipo Descrizione
code

string

Uno di un set definito dal server di codici di errore.

details

DocumentIntelligenceError[]

Matrice di dettagli sugli errori specifici che hanno causato l'errore segnalato.

innererror

DocumentIntelligenceInnerError

Oggetto contenente informazioni più specifiche dell'oggetto corrente sull'errore.

message

string

Rappresentazione leggibile dell'errore.

target

string

Destinazione dell'errore.

DocumentIntelligenceErrorResponse

Oggetto risposta di errore.

Nome Tipo Descrizione
error

DocumentIntelligenceError

Informazioni sull'errore.

DocumentIntelligenceInnerError

Oggetto contenente informazioni più specifiche sull'errore.

Nome Tipo Descrizione
code

string

Uno di un set definito dal server di codici di errore.

innererror

DocumentIntelligenceInnerError

Errore interno.

message

string

Rappresentazione leggibile dell'errore.

StringIndexType

Metodo utilizzato per calcolare l'offset e la lunghezza delle stringhe.

Nome Tipo Descrizione
textElements

string

Carattere di visualizzazione percepito dall'utente o cluster grapheme, come definito da Unicode 8.0.0.

unicodeCodePoint

string

Unità di caratteri rappresentata da un singolo punto di codice Unicode. Usato da Python 3.

utf16CodeUnit

string

Unità di caratteri rappresentata da un'unità di codice Unicode a 16 bit. Usato da JavaScript, Java e .NET.