共用方式為


Microsoft Syntex 中模型的需求和限制

適用於: ✓ 所有自定義模型 |✓ 所有預先建置的模型

Microsoft Syntex 可讓您建立自定義模型和預先建置的模型。 視您選擇的模型類型而定,可能有不同的需求,例如文件類型和大小、需要支援的語言、地理考慮和其他因素,可協助您決定要使用的模型類型。

自訂模型:

預先建置的模型:

自訂模型

非結構化文件處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:.csv、.doc、.docx、.eml、 .heic、.heif、.htm、.html、.jpeg、.jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls 和 .xls .xlsx .xlsx ( 公式不會) 執行。
交談符號。 支援的語言
此模型支援所有以拉丁文為基礎的語言,包括:英文、法文、德文、義大利文和西班牙文。
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件:
- .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。
- 如果您的 .pdf 檔案已鎖定密碼,您必須先移除鎖定,再提交。
- 每個集合用於定型之文件的合併檔案大小不得超過 50 MB,且 PDF 檔的頁面不應超過 500 頁。
- 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 在 OCR 處理中,非常寬或具有奇數尺寸 (例如樓層規劃) 的影像可能會被截斷,並失去正確性。
- 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。
- 如果是從紙張文件掃描,掃描應該是高品質的影像。
- 必須使用拉丁字母 (英文字元) 。
請注意下列關於 office 文字型檔案和 OCR 掃描檔案 (.pdf、影像或.tiff) Microsoft差異:
- 所有檔案:在定型中 (截斷 64,000 個字元,以及針對文檔庫) 中的檔案執行時截斷。
- OCR 掃描的檔案:有 500 頁的限制。 OCR 只會處理 PDF 和圖像檔類型。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。

手繪多邊形文件處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:請參閱 檔類型需求
交談符號。 支援的語言
此模型支援下列語言:請參閱 一般檔的模型
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合用於符合 這些需求的檔。
帶寬/效率符號。 優化秘訣
如果您的模型未如預期般執行,請嘗試 下列步驟來改善模型的效能。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
區塊符號。 自訂 Power 平台環境
如果您使用自定義環境 (而非 Power Platform 處理的預設環境) ,則還有其他設定需求。 如需詳細資訊,請參閱 自定義電源平台環境
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 每個連結庫只能有一個手繪多邊形或一個結構化模型。

結構化文件處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:請參閱 檔類型需求
交談符號。 支援的語言
此模型支援下列語言:請參閱 固定範本檔的模型
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合用於符合 這些需求的檔。
帶寬/效率符號。 優化秘訣
如果您的模型未如預期般執行,請嘗試 下列步驟來改善模型的效能。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
區塊符號。 自訂 Power 平台環境
如果您使用自定義環境 (而非 Power Platform 處理的預設環境) ,則還有其他設定需求。 如需詳細資訊,請參閱 自定義電源平台環境
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 每個連結庫只能有一個手繪多邊形或一個結構化模型。

預先建立的模型

合約處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。
交談符號。 支援的語言
此模型僅支援英文語言合約。
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件:
- .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。
- 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。
- 檔案大小必須小於 50 MB。
- 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。
- 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。
- 定型數據的總大小為500頁或更少。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。

發票處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。
交談符號。 支援的語言
此模型支援英文、西班牙文、德文、法文、義大利文、葡萄牙文和荷蘭文的發票。
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件:
- .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。
- 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。
- 檔案大小必須小於 50 MB。
- 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。
- 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。
- 定型數據的總大小為500頁或更少。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。

收據處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。
交談符號。 支援的語言
此模型支援英文、Croation、捷克文、丹麥文、荷蘭文、芬蘭文、德文、匈牙利文、義大利文、日文、拉脫維亞文、立陶宛文、挪威文、葡萄牙文、西班牙文、瑞典文和越南文的收據。
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件:
- .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。
- 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。
- 檔案大小必須小於 50 MB。
- 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。
- 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。
- 定型數據的總大小為500頁或更少。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。

敏感性信息處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:.csv、 .doc、.docx、.eml、.heic、.heif、.htm、.html、.jpeg、.jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls 和 .xlsx。
交談符號。 支援的語言
此模型支援下列語言:請參閱 支援的語言
此模型也支援 手寫文字列印文字的語言。
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件:
- .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。
- 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。
- 檔案大小必須小於 50 MB。
- 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。
- 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。
- 定型數據的總大小為500頁或更少。
支援 手寫文字列印文字的語言。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。

簡單文件處理

圖示 描述
檔案符號。 支援的檔案類型
此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。
交談符號。 支援的語言
此模型支持超過100種語言的檔。
段落符號。 OCR 考慮
此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件:
- .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。
- 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。
- 檔案大小必須小於 50 MB。
- 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。
- 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。
- 定型數據的總大小為500頁或更少。
地球符號。 多地理位置環境
Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。
物件符號。 多模型連結庫
如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。