文件智慧服務美國稅務文件模型
此內容適用於: v4.0 (GA) | 舊版: v3.1 (GA) ::moniker-end
此內容適用於: v3.1 (GA) | 最新版本: v4.0 (GA)
文件智慧稅務模型使用功能強大的光學字元辨識(OCR)功能,從選取的稅務檔群組中分析及擷取關鍵字段和明細專案。 稅務檔可以是各種格式,例如 1099、1098、W2、1040、1095A、1095C、W-4、1099-SSA。 輸入格式可以包含手機擷取的影像、掃描的檔和數位 PDF。 API 會分析檔文字;擷取重要資訊,並傳回結構化 JSON 數據表示法。 此模型目前支援特定的英文稅務文件格式。
支援的稅務欄位類型:
- 美國統一稅務
- W-2
- 1098
- 1098-E
- 1098-T
- 1099 和變化 (新增 1099-SSA)
- 1040 和變化
- 1095A、1095C
- W-4
自動化稅務文件處理
自動化稅務文件處理是從稅務文件中擷取重要欄位的流程。 在過去,稅賦文件為手動處理。 此模型可讓稅賦案例輕鬆自動化。
美國統一稅務
Unified US Tax
預先建置的模型會自動偵測及擷取所W2
提交檔中的 、1098
、 1040
和 1099
稅務窗體中的數據。 這些文件可以由許多稅務或非稅務相關文件組成。 此模型只會處理其支援的表單。
開發選項
檔案智慧 v4.0: 2024-11-30 (GA) 支援下列工具、應用程式和連結庫:
功能 | 資源 | Model ID |
---|---|---|
美國稅務表單模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK |
• prebuilt-tax.us• prebuilt-tax.us.W-2 • prebuilt-tax.us.W-4 • prebuilt-tax.us.1095A • prebuilt-tax.us.109 5C • prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T • prebuilt-tax.us.1 1099A • prebuilt-tax.us.1099B • prebuilt-tax.us.1099C • prebuilt-tax.us.1099CAP • prebuilt-tax. us.1099Combo • prebuilt-tax.us.1099DIV • prebuilt-tax.us.1099G • prebuilt-tax.us.1099H • prebuilt-tax.us.1099INT• prebuilt-tax.us.1099K • prebuilt-tax.us.1099LS • prebuilt-tax.us.1099LTC • prebuilt-tax.us.1099MISC• prebuilt-tax.us.1099NEC • prebuilt-tax.us.1099OID • prebuilt-tax.us.1 1099PATR • prebuilt-tax.us.1099Q • prebuilt-tax.us.1099QA • prebuilt-tax.us.1099R • prebuilt-tax. us.1099S • prebuilt-tax.us.1099SA • prebuilt-tax.us.1099SB • prebuilt-tax.us.1099SSA • prebuilt-tax.us.1040• prebuilt-tax.us.1040Schedule1 • prebuilt-tax.us.1040Schedule2 • prebuilt-tax.us.1040Schedule3 • prebuilt-tax.us.1040Schedule8812 • prebuilt-tax.us.1040ScheduleA• prebuilt-tax.us.1040ScheduleA •built-tax.us.1040ScheduleB • prebuilt-tax.us.1040ScheduleC • prebuilt-tax.us.1040ScheduleD • prebuilt-tax.us.1040ScheduleE• prebuilt-tax.us.1040ScheduleEIC • prebuilt-tax.us.1040ScheduleF • prebuilt-tax.us.1040ScheduleH • prebuilt-tax.us.1040ScheduleJ • prebuilt-tax.us.1040ScheduleR • prebuilt-tax.us.1040ScheduleSE • prebuilt-tax.us.1040Senior |
文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
美國稅務表單模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK |
prebuilt-tax.us.W-2 prebuilt-tax.us.1098 prebuilt-tax.us.1098E prebuilt-tax.us.1098T |
文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
美國稅務表單模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK |
prebuilt-tax.us.W-2 prebuilt-tax.us.1098 prebuilt-tax.us.1098E prebuilt-tax.us.1098T |
輸入需求
支援的檔案格式:
模型 PDF 影像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML參閱 ✔ ✔ ✔ 版面配置 ✔ ✔ ✔ 一般文件 ✔ ✔ 預建 ✔ ✔ 自訂擷取 ✔ ✔ 自訂分類 ✔ ✔ ✔ 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為
4
MB。影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為
1
GB。針對自訂分類模型定型,定型資料的大小總計為
1
GB (上限為 10,000 頁)。 對於 2024-11-30 (GA),訓練數據的總大小為2
GB,最多 10,000 頁。
嘗試稅務文件資料擷取
了解如何從發票擷取資料,包括客戶資訊、廠商詳細資料與明細項目。 您需要下列資源:
一個 Azure 訂用帳戶 - 您可以建立一個免費訂用帳戶。
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
Document Intelligence Studio
在文件智慧服務工作室首頁上,選取 支持的稅務文件模型。
您可以分析範例稅務文件,或上傳您自己的檔案。
選取 [執行分析] 按鈕,並視需要設定 [分析選項]:
支援的語言和地區設定
如需支援語言的完整清單,請參閱我們的語言支援 - 預建模型頁面。
欄位擷取
如需支持的檔擷取欄位,請參閱 GitHub 範例存放庫中的稅務檔模型架構頁面。
擷取的稅務文件機碼值組和明細項目位於 JSON 輸出的 documentResults
區段中。
下一步
使用文件智慧服務工作室嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
在 GitHub 上尋找更多範例 (英文)。
在 GitHub 上尋找更多範例 (英文)。