Microsoft Syntex 中模型的需求和限制
適用於: ✓ 所有自定義模型 |✓ 所有預先建置的模型
Microsoft Syntex 可讓您建立自定義模型和預先建置的模型。 視您選擇的模型類型而定,可能有不同的需求,例如文件類型和大小、需要支援的語言、地理考慮和其他因素,可協助您決定要使用的模型類型。
自訂模型:
預先建置的模型:
自訂模型
非結構化文件處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:.csv、.doc、.docx、.eml、 .heic、.heif、.htm、.html、.jpeg、.jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls 和 .xls .xlsx .xlsx ( 公式不會) 執行。 |
|
支援的語言 此模型支援所有以拉丁文為基礎的語言,包括:英文、法文、德文、義大利文和西班牙文。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件: - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。 - 如果您的 .pdf 檔案已鎖定密碼,您必須先移除鎖定,再提交。 - 每個集合用於定型之文件的合併檔案大小不得超過 50 MB,且 PDF 檔的頁面不應超過 500 頁。 - 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 在 OCR 處理中,非常寬或具有奇數尺寸 (例如樓層規劃) 的影像可能會被截斷,並失去正確性。 - 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。 - 如果是從紙張文件掃描,掃描應該是高品質的影像。 - 必須使用拉丁字母 (英文字元) 。 請注意下列關於 office 文字型檔案和 OCR 掃描檔案 (.pdf、影像或.tiff) Microsoft差異: - 所有檔案:在定型中 (截斷 64,000 個字元,以及針對文檔庫) 中的檔案執行時截斷。 - OCR 掃描的檔案:有 500 頁的限制。 OCR 只會處理 PDF 和圖像檔類型。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 |
手繪多邊形文件處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:請參閱 檔類型需求。 |
|
支援的語言 此模型支援下列語言:請參閱 一般檔的模型。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合用於符合 這些需求的檔。 |
|
優化秘訣 如果您的模型未如預期般執行,請嘗試 下列步驟來改善模型的效能。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
自訂 Power 平台環境 如果您使用自定義環境 (而非 Power Platform 處理的預設環境) ,則還有其他設定需求。 如需詳細資訊,請參閱 自定義電源平台環境。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 每個連結庫只能有一個手繪多邊形或一個結構化模型。 |
結構化文件處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:請參閱 檔類型需求。 |
|
支援的語言 此模型支援下列語言:請參閱 固定範本檔的模型。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合用於符合 這些需求的檔。 |
|
優化秘訣 如果您的模型未如預期般執行,請嘗試 下列步驟來改善模型的效能。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
自訂 Power 平台環境 如果您使用自定義環境 (而非 Power Platform 處理的預設環境) ,則還有其他設定需求。 如需詳細資訊,請參閱 自定義電源平台環境。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 每個連結庫只能有一個手繪多邊形或一個結構化模型。 |
預先建立的模型
合約處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。 |
|
支援的語言 此模型僅支援英文語言合約。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件: - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 |
發票處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。 |
|
支援的語言 此模型支援英文、西班牙文、德文、法文、義大利文、葡萄牙文和荷蘭文的發票。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件: - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 |
收據處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。 |
|
支援的語言 此模型支援英文、Croation、捷克文、丹麥文、荷蘭文、芬蘭文、德文、匈牙利文、義大利文、日文、拉脫維亞文、立陶宛文、挪威文、葡萄牙文、西班牙文、瑞典文和越南文的收據。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件: - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 |
敏感性信息處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:.csv、 .doc、.docx、.eml、.heic、.heif、.htm、.html、.jpeg、.jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls 和 .xlsx。 |
|
支援的語言 此模型支援下列語言:請參閱 支援的語言。 此模型也支援 手寫文字 和 列印文字的語言。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件: - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。 支援 手寫文字 和 列印文字的語言。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 |
簡單文件處理
圖示 | 描述 |
---|---|
支援的檔案類型 此模型支援下列檔類型:.bmp、.jpeg、.pdf、.png 和 .tiff。 |
|
支援的語言 此模型支持超過100種語言的檔。 |
|
OCR 考慮 此模型會使用光學字元識別 (OCR) 技術來掃描 .pdf 檔案、圖像檔和.tiff檔案。 OCR 處理最適合處理符合下列需求的文件: - .jpg、.png 或 .pdf (文字或掃描) 的檔格式。 文字內嵌 .pdf 檔案比較好,因為字元擷取和位置不會有任何錯誤。 - 針對 .pdf 和.tiff檔案,最多可以處理 2,000 頁。 - 檔案大小必須小於 50 MB。 - 對於影像,維度必須介於 50 x 50 和 10,000 x 10,000 像素之間。 - 針對 .pdf 檔案,維度必須最多為 11 x 17 英吋,對應至 Legal 或 A3 紙張大小且較小。 - 定型數據的總大小為500頁或更少。 |
|
多地理位置環境 在 Microsoft 365 多地理 位置環境中設定 Syntex 時,您只能將它設定為在中央位置使用模型類型。 如果您想要在衛星位置使用此模型類型,請連絡Microsoft支援。 |
|
多模型連結庫 如果將兩個以上的定型模型套用至相同的連結庫,則會使用具有最高平均信賴分數的模型來分類檔案。 擷取的實體只會來自套用的模型。 |