文件智慧服務發票模型
此內容適用於: v4.0 (GA) | 舊版: v3.1 (GA) v3.0 (GA) v2.1 (GA)
::: moniker-end
此內容適用於:v2.1最新版本: v4.0 (GA) |
文件智慧服務發票模型使用功能強大的光學字元辨識 (OCR) 功能,從銷售發票、公用事業帳單和訂購單中分析和擷取索引碼欄位和明細項目。 發票的格式與品質有各種類型,包括手機擷取的影像、掃描文件與數位 PDF。 API 會分析發票文字,擷取如客戶名稱、帳單地址、到期日和到期金額等重要資訊,以及傳回結構化 JSON 資料表示。 此模型目前支援 27 種語言的發票。
支援的文件類型:
- 發票
- 公用事業帳單
- 銷售訂單
- 採購單
自動化發票處理
自動化發票處理是從計費帳戶檔擷取密鑰 accounts payable
字段的程式。 擷取的資料包括發票的明細項目,這些發票已與應付帳款 (AP) 工作流程整合以供檢閱和付款。 在過去,應付帳款的程序都是手動執行,因此非常耗時。 從發票中精確擷取主要資料通常是發票自動化程序中的第一個且最重要的步驟之一。
使用文件智慧服務工作室處理的發票範例:
使用文件智慧服務範例標籤工具處理的發票範例:
開發選項
檔案智慧 v4.0: 2024-11-30 (GA) 支援下列工具、應用程式和連結庫:
功能 | 資源 | Model ID |
---|---|---|
發票模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK |
prebuilt-invoice |
文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
發票模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK |
prebuilt-invoice |
文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
發票模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK |
prebuilt-invoice |
文件智慧服務 v2.1 支援下列工具、應用程式和程式庫:
功能 | 資源 |
---|---|
發票模型 | • 文件智慧服務標記工具 • REST API • 用戶端-程式庫 SDK • 文件智慧服務 Docker 容器 |
輸入需求
支援的檔案格式:
模型 PDF 影像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML參閱 ✔ ✔ ✔ 版面配置 ✔ ✔ ✔ 一般文件 ✔ ✔ 預建 ✔ ✔ 自訂擷取 ✔ ✔ 自訂分類 ✔ ✔ ✔ 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為
4
MB。影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為
1
GB。針對自訂分類模型定型,定型資料的大小總計為
1
GB (上限為 10,000 頁)。 對於 2024-11-30 (GA),訓練數據的總大小為2
GB,最多 10,000 頁。
- 支援的檔案格式有:JPEG、PNG、PDF、TIFF。
- 支援 PDF 和 TIFF,最多可以處理 2,000 頁。 若是免費層訂閱者,只會處理前兩頁。
- 檔案大小必須小於 50 MB,尺寸至少 50 x 50 像素,最大為 10,000 x 10,000 像素。
發票模型資料擷取
了解如何從發票擷取資料,包括客戶資訊、廠商詳細資料與明細項目。 您需要下列資源:
一個 Azure 訂用帳戶 - 您可以建立一個免費訂用帳戶。
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
在文件智慧服務工作室首頁上,選取 [發票]。
您可以分析範例發票,或上傳您自己的檔案。
選取 [執行分析] 按鈕,並視需要設定 [分析選項]:
試用文件智慧服務工作室 (英文)
文件智慧服務範例標籤工具
在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。
從下拉式功能表選取要分析的 [表單類型]。
從下列選項中選擇您想要分析的檔案 URL:
在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。
在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。
在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。
選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。
檢視結果:查看擷取的索引鍵/值組、明細項目、擷取的醒目提示文字和偵測到的資料表。
注意
範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。
支援的語言和地區設定
如需支持語言的完整清單, 請參閱 我們 預先建置的模型語言支持 頁面。
欄位擷取
如需支持的檔擷取欄位, 請參閱 GitHub 範例存放庫中的 發票模型架構 頁面。
擷取的發票機碼值組和商品明細位於 JSON 輸出的
documentResults
區段中。
索引鍵/值組
預先建置的發票模型支援選擇性傳回機碼/值組。 根據預設,會停用索引鍵/值組傳回。 機碼值組是發票的特定範圍,可辨別標籤或索引碼,以及與其相關聯的回應或值。 在發票中,這些組可以是標籤,以及使用者針對該欄位或電話號碼輸入的值。 AI 模型已定型,可根據各種不同的檔案類型、格式和結構來擷取可識別的索引碼和值。
若模型偵測到索引鍵存在,且沒有相關聯的值或處理選用欄位時,索引鍵也可以單獨存在。 例如,在某些情況下,表單上的中間名稱欄位可以留空。 索引鍵/值組一律是文件中所包含的文字範圍。 若是文件對相同的值有不同的描述方式,例如客戶/使用者,則相關聯的關鍵為客戶或使用者,視前後文而定。
JSON 輸出
JSON 輸出有三個部分:
"readResults"
節點包含所有已辨識的文字和選取標記。 文字會透過頁面彙整,然後依文字行,再依個別字組彙整。"pageResults"
節點包含已擷取的資料表和儲存格,以及其週框方塊、信賴度以及對 readResults 中文句和字組的參考。"documentResults"
節點包含模型探索到的發票特定值和明細項目。 您會在這裡找到發票的所有欄位,例如發票識別碼、收件人、付款人、客戶、總計和明細項目等諸多資訊。
移轉指南
- 請遵循我們的文件智慧服務 v3.1 移轉指南,了解如何在應用程式和工作流程中使用 v3.0 版本。
::: moniker-end
下一步
使用文件智慧服務工作室嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
- 在 GitHub 上尋找更多範例 (英文)。
- 在 GitHub 上尋找更多範例 (英文)。
使用文件智慧服務範例標記工具嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。