Dokumentmodeller för inteckningsdokument för Dokumentinformation

Artikel
12/12/2024

Det här innehållet gäller för: v4.0 (GA)

Modellerna document intelligence mortgage använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) och djupinlärningsmodeller för att analysera och extrahera nyckelfält från inteckningsdokument. Inteckning dokument kan vara av olika format och kvalitet. API:et analyserar inteckningsdokument och returnerar en strukturerad JSON-datarepresentation. Modellerna stöder för närvarande endast engelskspråkiga dokument. Med den senaste V4.0 kan du nu extrahera signaturer från inteckningsapplikationer och formulär.

Dokumenttyper som stöds:

Enhetlig bostadslåneansökan (formulär 1003)
Enhetlig bostadsbedömningsrapport (formulär 1004)
Verifiering av anställningsformulär (formulär 1005)
Enhetlig försäkrings- och överföringssammanfattning (formulär 1008)
Formulär för att stänga offentliggörande

Utvecklingsalternativ

Document Intelligence v4.0 (2024-11-30-GA) stöder följande verktyg, program och bibliotek:

Funktion	Resurser	Model ID
Hypoteksmodell	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1004 • prebuilt-mortgage.us.1005 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure

Indatakrav

Filformat som stöds:

Modell	PDF	Bild: `JPEG/JPG`, `PNG`, `BMP`, , `TIFFHEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Lästa	✔	✔	✔
Layout	✔	✔	✔
Allmänt dokument	✔	✔
Inbyggda	✔	✔
Anpassad extrahering	✔	✔
Anpassad klassificering	✔	✔	✔

För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och 4 MB för den kostnadsfria nivån (F0).
Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om 8 punkttext vid 150 punkter per tum (DPI).
För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
- För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1 GB för den neurala modellen.
- För anpassad klassificeringsmodellträning är 1 den totala storleken på träningsdata GB med högst 10 000 sidor. För 2024-11-30 (GA) är 2 den totala storleken på träningsdata GB med högst 10 000 sidor.

Prova dataextrahering av inteckningsdokument

Om du vill se hur dataextrahering fungerar för tjänsten för inteckningsdokument behöver du följande resurser:

En Azure-prenumeration – du kan skapa en kostnadsfritt.
En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure Portal.

Document Intelligence Studio

På startsidan för Document Intelligence Studio väljer du Inteckning.
Du kan analysera exempeldokumenten eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:

Prova Document Intelligence Studio

Språk och nationella inställningar som stöds

Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.

Fältextrahering

Information om vilka dokumentextraheringsfält som stöds finns på schemasidorna för inteckningsdokumentmodellen i vår GitHub-exempellagringsplats.

Nästa steg

Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.

Dela via