Modello di fattura di Informazioni sui documenti
Questo contenuto si applica a: v4.0 (GA) | Versioni precedenti: v3.1 (GA) v3.0 (GA) v2.1 (GA) v2.1 (GA)
::: moniker-end
Questo contenuto si applica a: v3.1 (GA) | Versione più recente: v4.0 (GA) | Versioni precedenti: v3.0 v2.1
Questo contenuto si applica a: v3.0 (GA) | Versioni più recenti: v4.0 (GA) v3.1 | Versione precedente: v2.1
Questo contenuto si applica a: versione 2.1 | più recente: v4.0 (GA)
Il modello di fattura di Informazioni sui documenti usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi e voci chiave da fatture di vendita, bollette e ordini di acquisto. Le fatture possono essere di vari formati e qualità, tra cui immagini acquisite al telefono, documenti digitalizzati e PDF digitali. L'API consente di analizzare il testo delle fatture, estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto, e restituire una rappresentazione dei dati JSON strutturati. Il modello supporta attualmente le fatture in 27 lingue.
Tipi di documenti supportati:
- Fatture
- Bollette
- Ordini cliente
- Ordini fornitore
Elaborazione automatizzata delle fatture
L'elaborazione automatica delle fatture è il processo di estrazione dei campi chiave accounts payable
dai documenti dell'account di fatturazione. I dati estratti includono le voci delle fatture integrate con i flussi di lavoro dei conti fornitori per revisioni e pagamenti. Tradizionalmente, il processo di contabilità fornitori veniva eseguito manualmente ed era di conseguenza molto dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dalle fatture è in genere il primo e uno dei passaggi più critici del processo di automazione delle fatture.
Fattura di esempio elaborata con Document Intelligence Studio:
Fattura di esempio elaborata con lo strumento di etichettatura di Informazioni sui documenti:
Opzioni di sviluppo
Document Intelligence v4.0: 2024-11-30 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di fattura | • Document Intelligence Studio • API REST • C# SDK • SDK Python • SDK Java • SDK JavaScript |
prebuilt-invoice |
Informazioni sui documenti v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di fattura | • Document Intelligence Studio • API REST • C# SDK • SDK Python • SDK Java • SDK JavaScript |
prebuilt-invoice |
Informazioni sui documenti v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di fattura | • Document Intelligence Studio • API REST • C# SDK • SDK Python • SDK Java • SDK JavaScript |
prebuilt-invoice |
Informazioni sui documenti v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello di fattura | • Strumento di etichettatura di Informazioni sui documenti • API REST • SDK libreria client • Contenitore Docker di Informazioni sui documenti |
Requisiti di input
Formati di file supportati:
Modello PDF Immagine: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e
4
MB per il livello gratuito (F0).Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e
1
GB per il modello neurale.Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1
GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono2
GB con un massimo di 10.000 pagine.
- Formati di file supportati: JPEG, PNG, PDF e TIFF.
- PDF e TIFF supportati. Vengono elaborate fino a 2.000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
- Le dimensioni del file supportate devono essere inferiori a 50 MB, ma devono essere almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.
Estrazione dei dati del modello di fattura
Vedere in che modo i dati, incluse le informazioni sul cliente, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:
Sottoscrizione di Azure: è possibile crearne una gratuitamente.
Istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.
Nella home page di Studio di Informazioni sui documenti selezionare Fatture.
È possibile analizzare la fattura di esempio o caricare file personalizzati.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le Opzioni di analisi:
Strumento di etichettatura di esempio di Informazioni sui documenti
Passare allo strumento di esempio di Informazioni sui documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.
Selezionare il Tipo di modulo da analizzare nel menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.
Nel campo dell'endpoint del servizio Informazioni sui documenti, incollare l'endpoint ottenuto con la sottoscrizione di Informazioni sui documenti.
Nel campo della chiave, incollare la chiave ottenuta dalla risorsa Informazioni sui documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Informazioni sui documenti chiama l'API Analyze Prebuilt e analizza il documento.
Visualizzare i risultati: vedere le coppie chiave-valore estratte, le voci, il testo evidenziato estratto e le tabelle rilevate.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento, non del servizio Informazioni sui documenti.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina di supporto del linguaggio del modello predefinito.
Estrazione di campi
Per i campi di estrazione dei documenti supportati, vedere la pagina relativa allo schema del modello di fattura nel repository di esempio GitHub.
Le coppie chiave-valore e le voci della fattura estratte si trovano nella sezione
documentResults
dell'output JSON.
Coppie chiave-valore
Il modello di fattura predefinito supporta la restituzione facoltativa di coppie chiave-valore. Per impostazione predefinita, la restituzione delle coppie chiave-valore è disabilitata. Le coppie chiave-valore sono intervalli specifici all'interno della fattura che identificano un'etichetta o una chiave e la risposta o il valore associato. In una fattura, queste coppie possono essere l'etichetta e il valore immessi dall'utente per tale campo o il numero di telefono. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi, formati e strutture di documenti.
Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave senza alcun valore associato o quando vengono elaborati campi facoltativi. Ad esempio, il campo del secondo nome può essere lasciato vuoto in un modulo in alcuni casi. Le coppie chiave-valore sono sempre intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).
Output JSON
L'output JSON ha tre parti:
- Il nodo
"readResults"
contiene tutto il testo e i segni di selezione riconosciuti. Il testo è organizzato in base alla pagina, quindi alla riga, infine in base a singole parole. - Il nodo
"pageResults"
contiene le tabelle e le celle estratte con i rettangoli delimitatori, l'attendibilità e un riferimento alle righe e alle parole nel campo readResults. - Il nodo
"documentResults"
contiene i valori specifici della fattura individuati dal modello. È la posizione in cui trovare tutti i campi della fattura, ad esempio l'ID fattura, l'indirizzo di spedizione, l'indirizzo di fatturazione, il cliente, il totale, le voci e molto altro ancora.
Guida alla migrazione
- Seguire le indicazioni della Guida alla migrazione di Informazioni sui documenti v3.1 per informazioni su come usare la versione v3.0 nelle applicazioni e nei flussi di lavoro.
::: moniker-end
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Studio di Informazioni sui documenti.
Completare la Guida introduttiva di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Informazioni sui documenti.
Completare un avvio rapido di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.