選擇 Azure AI 搜尋服務的服務層級
選擇服務存留期間固定定價層 (或 SKU),屬於建立搜尋服務的一部分。 在 Azure 入口網站 中,當您建立服務時,會在 [選取定價層] 頁面中指定層。 您可以在 PowerShell 或 Azure CLI 中,透過 -Sku
參數來指定層級。
此層級可決定:
- 服務上允許的索引和其他物件數目上限
- 分割區的大小和速度 (實體儲存體)
- 每月固定成本計費的費率,但如果您新增容量也會產生增量成本
在少數情況下,您選擇的層級會決定進階功能的可用性。
計費費率會顯示在 Azure 入口網站 的 [選取定價層] 頁面中。 您可以檢查定價頁面以了解區域費率,並檢閱規劃和管理成本以進一步了解計費模型。
注意
在 2024 年 4 月 3 日之後建立的搜尋服務,幾乎每個層級都會提供較大的分割區和較高的向量配額。 如需詳細資訊,請參閱服務限制。
層級說明
層級包括免費、基本、標準和儲存體最佳化幾種層級。 「標準」和「儲存體最佳化」可供數個設定和容量使用。 下列來自 Azure 入口網站 的螢幕快照顯示可用的定價層、減價層(您可以在 Azure 入口網站 和定價頁面上找到)。
免費會為較小的專案建立有限的搜尋服務,例如執行教學課程和程式碼範例。 在內部,系統資源會在多個訂閱者之間共用。 您無法調整免費服務、執行大量工作負載,且無法使用某些進階功能。 每個 Azure 訂用帳戶只能擁有一項免費搜尋服務。 如果服務長時間處於非使用中狀態,可能會刪除以釋出容量,特別是當區域處於容量限制之下時。
最常使用的可計費層級包括:
基本可以符合 SLA,並支援三個複本。
標準 (S1、S2、S3) 是預設值。 這可讓您更彈性調整工作負載。 您可以調整分割區和複本。 使用您所控制的專用資源,可以部署較大的專案、將效能最佳化,並增加容量。
某些層級是針對特定類型的工作設計:
標準 3 高密度 (S3 HD) 是適用於 S3 的主控模式,其中基礎硬體已針對大量較小的索引進行最佳化,適用於多租用戶情況。 S3 HD 的個別單位費用與 S3 相同,但硬體已針對大量較小的索引進行快速檔案讀取最佳化。
儲存體最佳化 (L1、L2) 層級提供比標準層級更低的每 TB 價格,並且更大的儲存體容量。 這些層級是針對不常進行變更的大型索引設計。 主要的缺點是較高的查詢延遲,因此您應針對特定應用程式需求進行驗證。
您可以在定價頁面上、Azure AI 搜尋服務中的服務限制一文,以及布建服務時的 [Azure 入口網站] 頁面上,深入瞭解各種層級。
依階層的區域可用性
支援的區域清單提供 Azure AI 搜尋服務提供的位置。
目前,有數個區域處於特定階層的容量,且無法用於新的搜尋服務。 如果您使用 Azure 入口網站 來建立搜尋服務,Azure 入口網站 會排除任何無法使用的區域層組合。
區域 | 由於超出容量而停用的階層 (SKU) | 建議的替代方案 |
---|---|---|
美國東部 2 | 基本、S1 | 美國中部 |
美國中南部 | 所有階層 | 美國中部 |
US Gov 維吉尼亞州 | 所有階層 | US Gov 亞利桑那州 |
西歐 | 所有階層 | 瑞典中部/北歐 |
美國西部 3 | 基本、S1 | 美國中部 |
北歐 | S2、S3、S3 HD、L1、L2 | 英國南部 |
依層級提供的功能可用性
所有層級都包含大部分的功能,包括免費層。 在少數情況下,層級會決定功能的可用性。 下表描述條件約束。
功能 | 階層考慮 |
---|---|
indexers | S3 HD 上無法使用索引子。 索引子在免費層上會有更多限制。 |
索引器 executionEnvironment 組態參數 |
將所有索引器處理釘選到只配置給搜尋服務的搜尋叢集的能力需要 S2 和更新版本。 |
AI 擴充 | 可在免費層上執行,但不建議。 |
輸出 (索引子) 存取權的受控或信任身分識別 | 免費層無法使用。 |
使用客戶自控的加密金鑰 | 免費層無法使用。 |
IP 防火牆存取權 | 免費層無法使用。 |
私人端點 (與 Azure Private Link 整合) | 免費層無法使用搜尋服務的輸入連線。 免費或 S3 HD 無法使用索引子與其他 Azure 資源所用的輸出連線。 免費、基本、S1 或 S3 HD 無法使用會使用技能集的索引子。 |
可用性區域 | 免費或基本層無法使用。 |
語意排名工具 | 免費層無法使用。 |
除非您為其提供足夠的容量,否則資源密集型功能可能無法正常運作。 例如,AI 擴充具有長時間執行的技能,除非資料集很小,否則在免費層服務上執行將會逾時。
上限
層級會決定服務本身的最大儲存空間,以及您可以建立的索引、索引子、資料來源、技能集和同義字對應數目上限。 如需所有限制的完整明細項目,請參閱 Azure AI 搜尋服務中的服務限制。
分割區大小和速度
層級定價包含每個分割區儲存體的詳細資料,範圍從基本層的 15 GB 到儲存體最佳化 (L2) 層的 2 TB。 不會發佈其他硬體特性,例如作業速度、延遲和傳輸速率,但專為特定解決方案架構設計的層級是建置在支援這些情節功能的硬體上。 如需分割區的詳細資訊,請參閱預估和管理容量及Azure AI 搜尋服務中的可靠性。
注意
從 2024 年 4 月開始,選取區域可以使用較高容量的分割區。 2024 年 5 月發行第二波更高容量的分割區。 如果您使用舊版搜尋服務,請考慮建立新的搜尋服務,以相同的計費費率享有更多容量。 如需詳細資訊,請參閱服務限制。 若要檢查搜尋服務的存留期,請參閱如何檢查服務建立日期。
計費費率
層級有不同的計費費率,且在較昂貴硬體上執行的層級費率較高,或提供更昂貴的功能。 如需 Azure AI 搜尋服務各層級的計費費率,請參閱 Azure 定價頁面。
建立服務之後,計費率會變成固定成本,讓您全天候執行服務,若您選擇增加更多容量,則會產生增量成本。
搜尋服務會以分割區 (針對儲存體) 和複本形式 (查詢引擎的執行個體) 配置計算資源。 一開始,服務會以其中一項建立,而計費費率包含這兩種資源。 不過,如果您調整容量,成本會以可計費費率的增量進行增減。
下列範例提供一個實例。 假設每月為 $100 計費費率。 如果您將搜尋服務保留為一個分割區和一個複本的初始容量,則 $100 是您在當月結束時需支付的費用。 不過,如果您新增兩個複本以求高可用性,則每月帳單會增加至 $300 (第一個複本分割區組為 $100,後面新增的兩個複本為 $200)。
此計費模型是據此概念:將計費費率套用至搜尋服務所使用搜尋單位 (SU) 的數目。 所有服務一開始都是在同一個 SU 上佈建,但您可以透過新增分割區或複本以增加 SU,處理較大的工作負載。 如需詳細資訊,請參閱如何預估搜尋服務的成本。
層級升級或降級
升級或降級層級並無內建支援。 如果您想切換至不同層級,方法如下:
在新層級建立新的搜尋服務。
將您的搜尋內容部署至新服務。 請遵循此檢查清單,確保您擁有所有內容。
當您確定不再需要舊的搜尋服務時,請加以刪除。
針對不想從頭開始重建的大型索引,請考慮使用備份與還原範例加以移動。
下一步
選擇定價層的最佳方式是從最低成本層開始,然後讓體驗和測試來進行您的決策要保留此服務,或是在較高層級建立新的服務。 針對後續步驟,建議您在一個層級上先建立搜尋服務,以容納您建議執行的測試層級,再檢閱下列指引以取得預估的成本和容量的建議。