共用方式為


檔智慧 payStub 模型

Document Intelligence payStub 模型結合了強大的光學字元辨識 (OCR) 功能與深度學習模型,以分析及擷取薪酬和收益數據從工資單。 API 會分析文件和檔案,以及薪資相關的資訊,並傳回結構化 JSON 資料表示法。

功能 version Model ID
payStub 模型 v4.0: 2024-11-30 (GA) prebuilt-payStub.us

嘗試進行payStub數據擷取

薪資單是雇主向員工發出的必要文件,提供特定付款期間的所得、扣除和凈付款資訊。 請參閱如何使用 prebuilt-payStub.us 模型擷取資料。 您需要下列資源:

Document Intelligence Studio

  1. 文件智慧服務工作室首頁上,選取 [薪資單]

  2. 您可以分析範例薪資單,或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,如有必要,設定 [分析選項]

輸入需求

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    參閱
    版面配置
    一般文件
    預建
    自訂擷取
    自訂分類
  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為 4 MB。

  • 影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1 GB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1 GB (上限為 10,000 頁)。 對於 2024-11-30 (GA),訓練數據的總大小為 2 GB,最多 10,000 頁。

支援的語言和地區設定

如需支持語言的完整清單, 請參閱 我們 預先建置的模型語言支持 頁面。

欄位擷取

如需支持的檔擷取字段,請參閱 GitHub 範例存放庫中的payStub模型架構頁面。

支援的地區設定

prebuilt-payStub.us 版本支援 en-us 地區設定。

下一步