Microsoft Syntex 中模型的需求和限制

發行項
10/15/2024

^{適用於： ✓ 所有自定義模型 |✓ 所有預先建置的模型}

Microsoft Syntex 可讓您建立自定義模型和預先建置的模型。視您選擇的模型類型而定，可能有不同的需求，例如文件類型和大小、需要支援的語言、地理考慮和其他因素，可協助您決定要使用的模型類型。

自訂模型：

非結構化文件處理
手繪多邊形文件處理
結構化文件處理

預先建置的模型：

合約處理
發票處理
收據處理
敏感性信息處理
簡單文件處理

自訂模型

非結構化文件處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：.csv、.doc、.docx、.eml、 .heic、.heif、.htm、.html、.jpeg、.jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls 和 .xls .xlsx .xlsx ( 公式不會) 執行。
	支援的語言此模型支援所有以拉丁文為基礎的語言，包括：英文、法文、德文、義大利文和西班牙文。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件： - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。文字內嵌 .pdf 檔案比較好，因為字元擷取和位置不會有任何錯誤。 - 如果您的 .pdf 檔案已鎖定密碼，您必須先移除鎖定，再提交。 - 每個集合用於定型之文件的合併檔案大小不得超過 50 MB，且 PDF 檔的頁面不應超過 500 頁。 - 對於影像，維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。在 OCR 處理中，非常寬或具有奇數尺寸 (例如樓層規劃) 的影像可能會被截斷，並失去正確性。 - 針對 .pdf 檔案，維度必須最多為 11 x 17 英吋，對應至 Legal 或 A3 紙張大小且較小。 - 如果是從紙張文件掃描，掃描應該是高品質的影像。 - 必須使用拉丁字母 (英文字元) 。請注意下列關於 office 文字型檔案和 OCR 掃描檔案 (.pdf、影像或.tiff) Microsoft差異： - 所有檔案：在定型中 (截斷 64,000 個字元，以及針對文檔庫) 中的檔案執行時截斷。 - OCR 掃描的檔案：有 500 頁的限制。 OCR 只會處理 PDF 和圖像檔類型。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。

手繪多邊形文件處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：請參閱檔類型需求。
	支援的語言此模型支援下列語言：請參閱一般檔的模型。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合用於符合這些需求的檔。
	優化秘訣如果您的模型未如預期般執行，請嘗試下列步驟來改善模型的效能。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	自訂 Power 平台環境如果您使用自定義環境 (而非 Power Platform 處理的預設環境) ，則還有其他設定需求。如需詳細資訊，請參閱自定義電源平台環境。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。每個連結庫只能有一個手繪多邊形或一個結構化模型。

結構化文件處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：請參閱檔類型需求。
	支援的語言此模型支援下列語言：請參閱固定範本檔的模型。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合用於符合這些需求的檔。
	優化秘訣如果您的模型未如預期般執行，請嘗試下列步驟來改善模型的效能。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	自訂 Power 平台環境如果您使用自定義環境 (而非 Power Platform 處理的預設環境) ，則還有其他設定需求。如需詳細資訊，請參閱自定義電源平台環境。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。每個連結庫只能有一個手繪多邊形或一個結構化模型。

預先建立的模型

合約處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：.bmp、.jpeg、.pdf、.png 和 .tiff。
	支援的語言此模型僅支援英文語言合約。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件： - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。文字內嵌 .pdf 檔案比較好，因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案，最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像，維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案，維度必須最多為 11 x 17 英吋，對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。

發票處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：.bmp、.jpeg、.pdf、.png 和 .tiff。
	支援的語言此模型支援英文、西班牙文、德文、法文、義大利文、葡萄牙文和荷蘭文的發票。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件： - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。文字內嵌 .pdf 檔案比較好，因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案，最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像，維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案，維度必須最多為 11 x 17 英吋，對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。

收據處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：.bmp、.jpeg、.pdf、.png 和 .tiff。
	支援的語言此模型支援英文、Croation、捷克文、丹麥文、荷蘭文、芬蘭文、德文、匈牙利文、義大利文、日文、拉脫維亞文、立陶宛文、挪威文、葡萄牙文、西班牙文、瑞典文和越南文的收據。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件： - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。文字內嵌 .pdf 檔案比較好，因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案，最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像，維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案，維度必須最多為 11 x 17 英吋，對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。

敏感性信息處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：.csv、 .doc、.docx、.eml、.heic、.heif、.htm、.html、.jpeg、.jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls 和 .xlsx。
	支援的語言此模型支援下列語言：請參閱支援的語言。此模型也支援手寫文字和列印文字的語言。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件： - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。文字內嵌 .pdf 檔案比較好，因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案，最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像，維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案，維度必須最多為 11 x 17 英吋，對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。支援手寫文字和列印文字的語言。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。

簡單文件處理

圖示	描述
	支援的檔案類型此模型支援下列檔類型：.bmp、.jpeg、.pdf、.png 和 .tiff。
	支援的語言此模型支持超過100種語言的檔。
	OCR 考慮此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件： - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。文字內嵌 .pdf 檔案比較好，因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案，最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像，維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案，維度必須最多為 11 x 17 英吋，對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。
	多地理位置環境在 Microsoft 365 多地理位置環境中設定 Syntex 時，您只能將它設定為在中央位置使用模型類型。如果您想要在衛星位置使用此模型類型，請連絡Microsoft支援。
	多模型連結庫如果將兩個以上的定型模型套用至相同的連結庫，則會使用具有最高平均信賴分數的模型來分類檔案。擷取的實體只會來自套用的模型。