Dokumentinformation – amerikanska skattedokumentmodeller
Det här innehållet gäller för: v4.0 (GA) | Tidigare versioner: v3.1 (GA) :::moniker-end
Det här innehållet gäller för: v3.1 (GA) | Senaste version: v4.0 (GA)
Skattemodellen dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från en utvald grupp med skattedokument. Skattedokument kan ha olika format som 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. Indataformat kan innehålla telefoninsamlade bilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande vissa format för engelska skattedokument.
Typer av skatteformulär som stöds:
- Enhetlig skatt USA
- W-2
- 1098
- 1098-E
- 1098-T
- 1099 och variationer (tillagt 1099-SSA)
- 1040 och variationer
- 1095A, 1095C
- W-4
Automatiserad bearbetning av skattedokument
Automatiserad bearbetning av skattedokument är processen för att extrahera nyckelfält från skattedokument. Tidigare har skattedokument bearbetats manuellt. Den här modellen möjliggör enkel automatisering av skattescenarier.
Enhetlig skatt USA
Den Unified US Tax
fördefinierade modellen identifierar och extraherar automatiskt data från W2
, 1098
, 1040
och 1099
skatteformulär i skickade dokument. Dessa dokument kan bestå av många skatte- eller icke-skatterelaterade dokument. Modellen bearbetar endast de formulär som den stöder.
Utvecklingsalternativ
Document Intelligence v4.0: 2024-11-30 (GA) stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Amerikanska skatteformulärmodeller | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us• prebuilt-tax.us.W-2 • prebuilt-tax.us.W-4 • prebuilt-tax.us.1095A • prebuilt-tax.us.1095C • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T • prebuilt-tax.us.1099A • prebuilt-tax.us.1099B • prebuilt-tax.us.1099C • prebuilt-tax.us.1099CAP • prebuilt-tax.. us.1099Combo • prebuilt-tax.us.1099DIV • prebuilt-tax.us.1099G • prebuilt-tax.us.1099H • prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K • prebuilt-tax.us.1099LS • prebuilt-tax.us.1099LTC • prebuilt-tax.us.1099MISC • prebuilt-tax.us.1099NEC • prebuilt-tax.us.1099OID • prebuilt-tax.us.1099PATR • prebuilt-tax.us.1099Q • prebuilt-tax.us.1099QA • prebuilt-tax.us.1099R • prebuilt-tax.. us.1099S • prebuilt-tax.us.1099SA • prebuilt-tax.us.1099SB • prebuilt-tax.us.1099SSA • prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1 • prebuilt-tax.us.1040Schedule2 • prebuilt--tax.us.1040Schedule3 • prebuilt-tax.us.1040Schedule8812 • prebuilt-tax.us.1040ScheduleA • prebuilt-tax.us.1040ScheduleB • prebuilt-tax.us.1040ScheduleC • prebuilt-tax.us.1040ScheduleD• prebuilt-tax.us.1040ScheduleD • prebuilt-tax.us.1040ScheduleE • prebuilt-tax.us.1040ScheduleEIC • prebuilt-tax.us.1040ScheduleF • prebuilt-tax.us.1040ScheduleH • prebuilt-tax.us.1040ScheduleJ • prebuilt-tax.us.1040ScheduleR • prebuilt-tax.us.1040ScheduleSE • prebuilt-tax.us.1040Senior |
Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Amerikanska skatteformulärmodeller | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.W-2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Amerikanska skatteformulärmodeller | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
• prebuilt-tax.us.W-2 • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T |
Indatakrav
Filformat som stöds:
Modell PDF Bild: JPEG/JPG
,PNG
,BMP
, ,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLästa ✔ ✔ ✔ Layout ✔ ✔ ✔ Allmänt dokument ✔ ✔ Inbyggda ✔ ✔ Anpassad extrahering ✔ ✔ Anpassad klassificering ✔ ✔ ✔ För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och
4
MB för den kostnadsfria nivån (F0).Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om
8
punkttext vid 150 punkter per tum (DPI).För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och
1
GB för den neurala modellen.För anpassad klassificeringsmodellträning är
1
den totala storleken på träningsdata GB med högst 10 000 sidor. För 2024-11-30 (GA) är2
den totala storleken på träningsdata GB med högst 10 000 sidor.
Prova extrahering av skattedokument
Se hur data, inklusive kundinformation, leverantörsinformation och radobjekt, extraheras från fakturor. Du behöver följande resurser:
En Azure-prenumeration – du kan skapa en kostnadsfritt.
En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (
F0
) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.
Document Intelligence Studio
På startsidan för Document Intelligence Studio väljer du den skattedokumentmodell som stöds.
Du kan analysera ett exempel på skattedokument eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera :
Språk och nationella inställningar som stöds
Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.
Fältextrahering
Information om vilka dokumentextraheringsfält som stöds finns på schemasidorna för skattedokumentmodell i vår GitHub-exempellagringsplats.
Nyckel/värde-par och radobjekt som extraheras finns i avsnittet i documentResults
JSON-utdata.
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.