服務配額和限制

發行項
01/15/2025

此內容適用於： v4.0 （GA） | 舊版： v3.1 （GA） v3.0 （GA）

此內容適用於：v2.1最新版本： v4.0 （GA） |

本文同時包含 Azure AI 文件智慧服務在所有定價層的配額和限制的快速參考及詳細描述。其也包含一些避免要求節流的最佳做法。

模型使用方式

支援的文件類型	參閱	版面配置	預建模型	自訂模型	附加元件功能
PDF	✔️	✔️	✔️	✔️	✔️
影像：`JPEG/JPG`、`PNG`、`BMP`、`TIFF`、`HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office：`DOCX`、`PPTX`、`XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = 支援 ✖️ = 不支援

支援的文件類型	參閱	版面配置	預建模型	自訂模型
PDF	✔️	✔️	✔️	✔️
影像：`JPEG/JPG`、`PNG`、`BMP`、`TIFF`、`HEIF`	✔️	✔️	✔️	✔️
Microsoft Office：`DOCX`、`PPTX`、`XLS`	✔️	✖️	✖️	✖️

✔️ = 支援 ✖️ = 不支援

計費

文件智慧服務計費會每月根據分析的模型類型和頁數來計費。您可以在 Azure 入口網站計量儀表板中找到使用計量。儀表板會顯示 Azure 文件智慧服務所處理的頁數。您可以使用 Azure 定價計算機來檢查花費在該資源上的預估成本。如需詳細指示，請參閱檢查我的使用量及預估成本。以下是一些詳細資料：

當您提交文件進行分析時，服務會分析所有頁面，除非您在要求中使用 pages 參數來指定頁面範圍。透過讀取、OCR 或版面配置模型分析 Microsoft Excel 和 PowerPoint 文件時，服務會將每個 Excel 工作表和 PowerPoint 投影片計算為一頁。
在分析 PDF 和 TIFF 檔案時，服務會將 PDF 檔案中的每個頁面或 TIFF 檔案中的每個影像計算為一個頁面，且沒有字元上限。
在分析讀取和版面配置模型支援的 Microsoft Word 和 HTML 檔案時，服務會將每 3,000 個字元的區塊計算為一頁。例如，若您的文件包含 7,000 個字元，則會分成兩個 3,000 個字元的頁面、一個 1,000 個字元的頁面，加起來總共三頁。
讀取和版面配置模型不支援分析 Microsoft Word、Excel、PowerPoint 和 HTML 檔案中內嵌或連結的影像。因此，服務不會將這些內容計算為新增的影像。
使用文件智慧服務定型自訂模型一律免費。只有在服務使用模型來分析文件時，才會向您收取費用。
容器定價與雲端服務定價相同。
文件智慧服務提供的免費層 (F0) 可讓您測試所有文件智慧服務功能。免費層限制只會分析要求中前兩頁的回應。
文件智慧服務具有適用於大型工作負載的承諾用量型定價模式。
需要配置模型，才能產生資料集的標籤以進行自訂訓練。如果您用於自訂訓練的資料集沒有可用的標籤檔案，服務就會為您產生標籤檔案，並向您收取配置模型使用量的費用。

配額	免費 (F0)¹	標準 (S0)
分析每秒交易限制	1	15 (預設值)
可調整	No	是 ²
取得每秒作業數限制	1	50 （預設值）
可調整	No	是 ²
模型管理作業每秒限制	1	5 (預設值)
可調整	No	是 ²
每秒清單作業數限制	1	10 （預設值）
可調整	No	是 ²
文件大小上限	4 MB	500 MB
可調整	No	No
頁數上限 (分析)	2	2000
可調整	No	No
標籤檔案的大小上限	10 MB	10 MB
可調整	No	No
OCR json 回應的大小上限	500 MB	500 MB
可調整	No	No
範本模型數目上限	500	5000
可調整	No	No
神經模型數目上限	100	500
可調整	No	No

自訂模型使用方式

配額	免費 (F0) ¹	標準 (S0)
撰寫模型限制	5	500 (預設值)
可調整	No	No
*訓練資料集大小神經和生成式**	1 GB ³	1 GB (預設值)
可調整	No	No
*定型資料集大小範本**	50 MB ⁴	50 MB (預設值)
可調整	No	No
*頁數上限 (定型) 範本**	500	500 (預設值)
可調整	No	No
*頁數上限 (訓練)神經和生成式**	50,000	50,000 (預設值)
可調整	No	No
自訂神經模型定型	每月 10 小時 ⁵	沒有限制（按小時付費），從每月10個免費小時開始
可調整	No	是 ³
*頁數上限 (定型) 分類器**	10,000	10,000 (預設值)
可調整	No	No
*文件類型 (類別) 數目上限分類器**	500	500 (預設值)
可調整	No	No
*定型資料集大小分類器**	1GB	2GB (預設值)
可調整	No	No
*每個類別的範例數目下限分類器**	5	5 (預設值)
可調整	No	No

自訂模型使用方式

配額	免費 (F0) ¹	標準 (S0)
撰寫模型限制	5	200 (預設值)
可調整	No	No
*定型資料集大小類神經**	1 GB ³	1 GB (預設值)
可調整	No	No
*定型資料集大小範本**	50 MB ⁴	50 MB (預設值)
可調整	No	No
*頁數上限 (定型) 範本**	500	500 (預設值)
可調整	No	No
*頁數上限 (定型) 類神經**	50,000	50,000 (預設值)
可調整	No	No
自訂神經模型定型	每月美金 10 元	每月美金 20 元
可調整	No	是 ³
*頁數上限 (定型) 分類器**	10,000	10,000 (預設值)
可調整	No	No
*文件類型 (類別) 數目上限分類器**	500	500 (預設值)
可調整	No	No
*定型資料集大小分類器**	1GB	1GB (預設值)
可調整	No	No
*每個類別的範例數目下限分類器**	5	5 (預設值)
可調整	No	No

自訂模型使用方式

配額	免費 (F0) ¹	標準 (S0)
撰寫模型限制	5	200 (預設值)
可調整	No	No
*定型資料集大小類神經**	1 GB ³	1 GB (預設值)
可調整	No	No
*定型資料集大小範本**	50 MB ⁴	50 MB (預設值)
可調整	No	No
*頁數上限 (定型) 範本**	500	500 (預設值)
可調整	No	No
*頁數上限 (定型) 類神經**	50,000	50,000 (預設值)
可調整	No	No
自訂神經模型定型	每月美金 10 元	每月美金 20 元
可調整	No	是 ³
*頁數上限 (定型) 分類器**	10,000	10,000 (預設值)
可調整	No	No
*文件類型 (類別) 數目上限分類器**	500	500 (預設值)
可調整	No	No
*定型資料集大小分類器**	1GB	1GB (預設值)
可調整	No	No
*每個類別的範例數目下限分類器**	5	5 (預設值)
可調整	No	No

自訂模型限制

配額	免費 (F0) ¹	標準 (S0)
撰寫模型限制	5	200 (預設值)
可調整	No	No
定型資料集大小	50 MB	50 MB (預設值)
可調整	No	No
頁數上限 (定型)	500	500 (預設值)
可調整	No	No

¹ 如需 免費 (F0) 定價層，另請參閱定價頁面的每月額度。
² 請參閱最佳做法和調整指示。
³ 神經模型定型計數會在每個日曆月份重設。提出支援要求來提高每月定型限制。從 v4.0 API 開始，在日曆月份超過 20 個要求的定型要求會在訓練層上計費。如需詳細資料，請參閱定價。

⁴ 此限制適用於任何標籤相關更新之前在定型資料集資料夾中找到的所有文件。

⁵ 此限制僅適用於 v 4.0 (2024-11-30 GA) 自訂神經模型。從 v 4.0 開始，我們支援訓練較長持續時間的大型檔案 (最多 10 小時免費，並在之後產生費用)。如需詳細資訊，請參閱自定義神經模型頁面。

詳細描述、配額調整和最佳做法

透過支援票證要求增加，即可延長預設限制。在要求增加配額 (如果適用) 之前，請確定有必要。文件智慧服務使用自動調整來導入必要的計算資源 on-demand、壓低客戶成本，並透過不維持過量的硬體容量來取消佈建未使用的資源。

如果您的應用程式傳回回應碼 429 （要求太多），則您超過每秒一或多個交易限制的閾值（TPS）：

分析每秒交易限制 提交分析要求的 TPS （POST）
取得每秒的作業限制 TPS 來輪詢分析作業的結果（GET）
模型管理作業每秒限制 與模型管理相關的作業，例如建置/定型和複製。
列出作業每秒限制 與列出模型、作業相關的作業。

在自動調整期間降低節流的一般最佳做法

若要將節流 (回應碼 429) 的相關問題降至最低，我們建議使用下列技術：

在您的應用程式中實作重試邏輯
避免工作負載急遽變化。逐漸增加工作負載
例如： 應用程式使用文件智慧服務，而目前的工作負載是 10 TPS (每秒交易數)。下一秒，您會將負載增加到 40 TPS。結果是某些要求的 429 回應碼，因為您超過提交分析作業的 15 個 TPS 限制。您可以回復處理，以保持在 15 TPS 之下，或要求增加 TPS 以支援較高的磁碟區。

下一節將描述調整配額的特定案例。跳至文件智慧服務：增加並行要求限制

提高每秒交易數要求限制

針對文件智慧服務資源，每秒交易數預設以每秒 15 筆交易為限。若為標準定價層，則可以增加此限制數量。提交要求之前，請確定您熟悉本節的內容，並了解這些最佳做法。

第一個步驟是啟用自動調整。請遵循本文件，在您的資源上啟用自動調整 * 啟用自動調整。啟用自動調整后，您的資源可以繼續接受服務容量時所設定 TPS 限制的要求。它仍會導致要求節流。

增加並行要求限制並不會直接影響成本。文件智慧服務使用「用多少付多少」模式。此限制會定義服務在開始對要求進行節流之前可調整的上限。

不同的要求限制類別的現有值可透過 Azure 入口網站，在資源概觀刀鋒視窗的 [監視] 索引卷標下取得。

建立並提交 TPS 增加的支援要求

提交支援要求，以開始提高資源的每秒交易數 (TPS) 限制：

登入 Azure 入口網站
選取您要提高 TPS 限制的文件智慧服務資源
選取 -新支援要求- (-支援 + 疑難排解- 群組)。新視窗即會出現，其中會自動填入 Azure 訂用帳戶和 Azure 資源的相關資訊
輸入 -摘要- (例如「增加文件智慧服務 TPS 限制」)
在問題類型欄位，選取 [配額或使用量驗證]。
選取 -下一步：解決方案-
繼續進行建立要求的作業
在 [詳細資料] 索引標籤下，在 -描述- 欄位中輸入下列資訊：
- 請注意，要求是關於文件智慧服務的配額。
- 提供您想要調整來達到的 TPS 預期。雖然 TPS 增加是免費的，但您應該只要求對您的工作負載合理的 TPS。
- Azure 資源資訊
- 完成輸入必要資訊，然後選取 -檢閱 + 建立- 索引標籤中選取 -建立- 按鈕
- 請記下 Azure 入口網站通知中的支援要求編號。希望客戶支援儘快與您連絡，以進一步進行處理。

工作負載模式最佳做法的範例

此範例會顯示我們建議的方法，以減少因進行自動調整所造成的可能要求節流。這不是準確做法，只是我們建議遵循的範本，請視需要調整。

假設文件智慧服務資源已設定預設限制。啟動工作負載以提交您的分析要求。如果您發現在檢查完成時看到響應碼為 429 的頻繁節流，請從在 GET 分析回應要求上實作指數輪詢開始。在連續錯誤回應的重試之間，使用越來越長的等候時間，例如要求之間 2-5-13-34 的延遲模式。一般而言，針對對應的 POST 要求，我們建議不要每 2 秒呼叫 GET 分析回應一次以上。回應 analyze 也包含一個 重試后 標頭，指出在檢查該要求完成之前，應該等待多久的時間。

針對提交的文件，如果您發現 POST 要求數目受到節流，請考慮在要求之間加上延遲。如果工作負載需要更高度的同時處理，則您必須建立支援要求，以提高每秒交易數的服務限制。

一般而言，在進入實際執行環境之前，我們建議先測試工作負載和工作負載模式。

下一步

了解錯誤碼和疑難排解

共用方式為

服務配額和限制

模型使用方式

計費

自訂模型使用方式

自訂模型使用方式

自訂模型使用方式

自訂模型限制

詳細描述、配額調整和最佳做法

在自動調整期間降低節流的一般最佳做法

提高每秒交易數要求限制

建立並提交 TPS 增加的支援要求

工作負載模式最佳做法的範例

下一步

意見反應

其他資源