Usare un modello predefinito per estrarre informazioni da documenti semplici in Microsoft Syntex
Il modello di elaborazione documenti semplice offre una soluzione flessibile e con training preliminare per l'estrazione di informazioni da documenti strutturati di base, incluse informazioni quali:
Coppie chiave-valore : si pensi a queste etichette come e alle relative informazioni corrispondenti, ad esempio "Nome: Adele Vance".
Segni di selezione : si tratta di caselle di controllo o altri segni che indicano scelte o selezioni in un documento.
Entità denominate : si tratta di elementi specifici, ad esempio nomi di persone, luoghi o organizzazioni menzionati nel testo di un documento.
Codici a barre : rappresentazioni di dati leggibili dal computer che possono essere usate per scopi di rilevamento o identificazione in un documento.
A differenza di altri modelli predefiniti con schemi fissi, questo modello può identificare le chiavi che potrebbero mancare ad altri, fornendo un'alternativa preziosa all'etichettatura e al training dei modelli personalizzati. Questo modello supporta anche i codici a barre e il rilevamento della lingua.
Tipi di documenti
L'elaborazione semplice dei documenti funziona meglio con i tipi di documenti che contengono informazioni strutturate, ad esempio:
Forms: spesso hanno campi ed etichette chiari, semplificando l'estrazione di coppie chiave-valore.
Fatture : in genere includono layout coerenti con tabelle e coppie chiave-valore.
Ricevute : analogamente alle fatture, hanno dati strutturati che possono essere facilmente estratti.
Contratti : contengono sezioni e clausole ben definite che possono essere analizzate in modo efficace.
Rendiconti bancari : includere tabelle e dati strutturati ideali per l'estrazione.
Questi documenti traggono vantaggio dalle funzionalità di riconoscimento ottico dei caratteri (OCR) e dai processi di deep learning usati per estrarre coppie chiave-valore, segni di selezione, tabelle ed entità denominate.
Nota
Attualmente, questo modello è disponibile per .pdf e tipi di file di immagine e in più di 100 lingue. Altri tipi di file supportati verranno aggiunti nelle versioni future.
Per usare un modello di elaborazione documenti semplice, seguire questa procedura:
- Passaggio 1: Creare il modello
- Passaggio 2: Caricare un file di esempio da analizzare
- Passaggio 3: Selezionare gli estrattori per il modello
- Passaggio 4: Applicare il modello
Passaggio 1: Creare il modello
Seguire le istruzioni riportate in Creare un modello in Syntex per creare un modello di elaborazione documenti semplice. Continuare quindi con i passaggi seguenti per completare il modello.
Passaggio 2: Caricare un file di esempio da analizzare
Nella sezione Aggiungi un file da analizzare della pagina Modelli selezionare Aggiungi un file.
Nella pagina File per analizzare il modello selezionare Aggiungi per trovare il file da usare.
Nella pagina Aggiungi un file dalla raccolta di file di training selezionare il file e quindi selezionare Aggiungi.
Nella pagina File per analizzare il modello selezionare Avanti.
Passaggio 3: Selezionare gli estrattori per il modello
Nella pagina dei dettagli dell'estrattore viene visualizzata l'area del documento a destra della pagina e il pannello Estrattori a sinistra. Il pannello Estrattori mostra l'elenco degli estrattori identificati nel documento.
I campi entità evidenziati in verde nell'area del documento sono gli elementi rilevati dal modello durante l'analisi del file. Quando si seleziona un'entità da estrarre, il campo evidenziato diventa blu. Se in seguito si decide di non includere l'entità, il campo evidenziato diventa grigio. Le evidenziazioni semplificano la visualizzazione dello stato corrente degli estrattori selezionati.
Consiglio
Per eseguire lo zoom avanti o indietro per leggere i campi dell'entità, usare la rotellina di scorrimento del mouse o i controlli di zoom nella parte inferiore dell'area del documento.
Selezionare un'entità estrattore
È possibile selezionare un estrattore dall'area del documento o dal pannello Estrattori , a seconda delle preferenze.
- Per selezionare un estrattore dall'area del documento, selezionare il campo dell'entità.
- Per selezionare un estrattore dal pannello Estrattori , nella colonna Estrai selezionare la casella di controllo corrispondente a destra del nome dell'entità.
Quando si seleziona un estrattore, la casella Seleziona estrattore? viene visualizzata nell'area del documento. La casella mostra il nome della chiave (il nome generato per l'estrattore), il valore rilevato (il valore di tale campo nel documento), il tipo di colonna e l'opzione per selezionare l'entità come estrattore.
Il nome della chiave viene usato come nome di colonna quando il modello viene applicato a una raccolta di SharePoint. È possibile modificare il nome della chiave in modo che sia più descrittivo, se si vuole. Il tipo di colonna mostra come vengono visualizzate le informazioni in una libreria. È possibile modificare il tipo di colonna per visualizzare le informazioni. Quando il modello viene applicato a una raccolta, è possibile usare la formattazione di colonna per specificare l'aspetto desiderato nel documento.
Continuare a selezionare altri estrattori da usare. È anche possibile aggiungere altri file da analizzare per questa configurazione del modello.
Rinominare un estrattore
È possibile rinominare un estrattore in tre modi:
Nell'area del documento della pagina dei dettagli dell'estrattore selezionare il campo dell'entità. Nella casella Seleziona estrattore? immettere un nuovo nome per l'estrattore nel campo Nome chiave .
Nel pannello Estrattori della pagina dei dettagli dell'estrattore selezionare l'estrattore da rinominare e quindi selezionare Rinomina.
Nella home page del modello, nella sezione Estrattori selezionare l'estrattore da rinominare e quindi selezionare Rinomina.
Impostare un intervallo di pagine per l'elaborazione
Per questo modello, è possibile specificare di elaborare un intervallo di pagine per un file anziché l'intero file. Nella sezione Intervallo di pagine del pannello Estrattori selezionare la pagina da elaborare. Per impostazione predefinita, l'impostazione Intervallo di pagine è vuota. Se non viene specificato alcun intervallo di pagine, l'intero documento viene elaborato. Per altre informazioni, vedere Impostare un intervallo di pagine per estrarre informazioni da pagine specifiche.
Rilevare la lingua di un documento
Per questo modello, è possibile rilevare la lingua di un documento ed estrarla in una colonna. Nel pannello Estrattori , nella sezione Rilevamento lingua , attivare o disattivare il rilevamento della lingua. Mostra il codice ISO del linguaggio rilevato.
È anche possibile attivare o disattivare il rilevamento della lingua dal pannello Impostazioni modello per il modello.
Passaggio 4: Applicare il modello
Per salvare le modifiche e tornare alla home page del modello, nel pannello Estrattori selezionare Salva e esci.
Se si è pronti per applicare il modello a una raccolta, nell'area del documento selezionare Avanti. Nel pannello Aggiungi alla libreria scegliere la libreria a cui si vuole aggiungere il modello e quindi selezionare Aggiungi.