Dela via


Dokumentinformation – amerikanska skattedokumentmodeller

Det här innehållet gäller för:Bockmarkering v4.0 (GA) | Tidigare versioner:blå bockmarkering v3.1 (GA) :::moniker-end

Det här innehållet gäller för: Bockmarkering v3.1 (GA) | Senaste version: lila bockmarkering v4.0 (GA)

Skattemodellen dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från en utvald grupp med skattedokument. Skattedokument kan ha olika format som 1099, 1098, W2, 1040, 1095A, 1095C, W-4, 1099-SSA. Indataformat kan innehålla telefoninsamlade bilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande vissa format för engelska skattedokument.

Typer av skatteformulär som stöds:

  • Enhetlig skatt USA
  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 och variationer (tillagt 1099-SSA)
  • 1040 och variationer
  • 1095A, 1095C
  • W-4

Automatiserad bearbetning av skattedokument

Automatiserad bearbetning av skattedokument är processen för att extrahera nyckelfält från skattedokument. Tidigare har skattedokument bearbetats manuellt. Den här modellen möjliggör enkel automatisering av skattescenarier.

Enhetlig skatt USA

Den Unified US Tax fördefinierade modellen identifierar och extraherar automatiskt data från W2, 1098, 1040och 1099 skatteformulär i skickade dokument. Dessa dokument kan bestå av många skatte- eller icke-skatterelaterade dokument. Modellen bearbetar endast de formulär som den stöder.

Skärmbild av ett diagram över bearbetning av enhetlig skatt.

Utvecklingsalternativ

Document Intelligence v4.0: 2024-11-30 (GA) stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Amerikanska skatteformulärmodeller Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us• prebuilt-tax.us.W-2
• prebuilt-tax.us.W-4
• prebuilt-tax.us.1095A
• prebuilt-tax.us.1095C
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.. us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H

prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC
• prebuilt-tax.us.1099NEC
• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.. us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1099SSA

prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt--tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF

prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Amerikanska skatteformulärmodeller Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Amerikanska skatteformulärmodeller Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Indatakrav

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, , TIFFHEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lästa
    Layout
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering
  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om 8 punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1 GB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1 den totala storleken på träningsdata GB med högst 10 000 sidor. För 2024-11-30 (GA) är 2 den totala storleken på träningsdata GB med högst 10 000 sidor.

Prova extrahering av skattedokument

Se hur data, inklusive kundinformation, leverantörsinformation och radobjekt, extraheras från fakturor. Du behöver följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt.

  • En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure Portal.

Document Intelligence Studio

  1. På startsidan för Document Intelligence Studio väljer du den skattedokumentmodell som stöds.

  2. Du kan analysera ett exempel på skattedokument eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera :

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Språk och nationella inställningar som stöds

Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.

Fältextrahering

Information om vilka dokumentextraheringsfält som stöds finns på schemasidorna för skattedokumentmodell i vår GitHub-exempellagringsplats.

Nyckel/värde-par och radobjekt som extraheras finns i avsnittet i documentResults JSON-utdata.

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.