共用方式為


文件智慧服務美國稅務文件模型

此內容適用於: v4.0 (GA) | 舊版: 勾選記號blue-checkmarkv3.1 (GA) ::moniker-end

此內容適用於: v3.1 (GA) | 最新版本:purple-checkmark勾選記號 v4.0 (GA)

文件智慧稅務模型使用功能強大的光學字元辨識(OCR)功能,從選取的稅務檔群組中分析及擷取關鍵字段和明細專案。 稅務檔可以是各種格式,例如 1099、1098、W2、1040、1095A、1095C、W-4、1099-SSA。 輸入格式可以包含手機擷取的影像、掃描的檔和數位 PDF。 API 會分析檔文字;擷取重要資訊,並傳回結構化 JSON 數據表示法。 此模型目前支援特定的英文稅務文件格式。

支援的稅務欄位類型:

  • 美國統一稅務
  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 和變化 (新增 1099-SSA)
  • 1040 和變化
  • 1095A、1095C
  • W-4

自動化稅務文件處理

自動化稅務文件處理是從稅務文件中擷取重要欄位的流程。 在過去,稅賦文件為手動處理。 此模型可讓稅賦案例輕鬆自動化。

美國統一稅務

Unified US Tax預先建置的模型會自動偵測及擷取所W2提交檔中的 、109810401099 稅務窗體中的數據。 這些文件可以由許多稅務或非稅務相關文件組成。 此模型只會處理其支援的表單。

統一稅務處理圖表的螢幕擷取畫面。

開發選項

檔案智慧 v4.0: 2024-11-30 (GA) 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
美國稅務表單模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
• prebuilt-tax.us• prebuilt-tax.us.W-2
• prebuilt-tax.us.W-4
• prebuilt-tax.us.1095A
• prebuilt-tax.us.109 5C
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1 1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax. us.1099Combo
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H

prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC• prebuilt-tax.us.1099NEC

• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1 1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax. us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1099SSA

prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA• prebuilt-tax.us.1040ScheduleA
•built-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE• prebuilt-tax.us.1040ScheduleEIC

• prebuilt-tax.us.1040ScheduleF

prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
美國稅務表單模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-tax.us.W-2
prebuilt-tax.us.1098
prebuilt-tax.us.1098E
prebuilt-tax.us.1098T

文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
美國稅務表單模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-tax.us.W-2
prebuilt-tax.us.1098
prebuilt-tax.us.1098E
prebuilt-tax.us.1098T

輸入需求

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    參閱
    版面配置
    一般文件
    預建
    自訂擷取
    自訂分類
  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為 4 MB。

  • 影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1 GB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1 GB (上限為 10,000 頁)。 對於 2024-11-30 (GA),訓練數據的總大小為 2 GB,最多 10,000 頁。

嘗試稅務文件資料擷取

了解如何從發票擷取資料,包括客戶資訊、廠商詳細資料與明細項目。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

Document Intelligence Studio

  1. 文件智慧服務工作室首頁上,選取 支持的稅務文件模型。

  2. 您可以分析範例稅務文件,或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,並視需要設定 [分析選項]

    文件智慧服務工作室中 [執行分析] 和 [分析選項] 按鈕的螢幕擷取畫面。

支援的語言和地區設定

如需支援語言的完整清單,請參閱我們的語言支援 - 預建模型頁面。

欄位擷取

如需支持的檔擷取欄位,請參閱 GitHub 範例存放庫中的稅務檔模型架構頁面。

擷取的稅務文件機碼值組和明細項目位於 JSON 輸出的 documentResults 區段中。

下一步