選取 Azure 數據總管叢集的 SKU
當您建立新的叢集或針對變更的工作負載優化叢集時,Azure 數據總管會提供多個虛擬機 (VM) SKU 可供選擇。 這些計算 SKU 已經過精心選擇,讓您在任何工作負載中獲得最佳成本。
數據管理叢集的大小和 VM SKU 完全由 Azure 數據總管服務管理。 它們取決於引擎的 VM 大小和擷取工作負載等因素。
您可以藉由 相應增加叢集,隨時變更叢集的計算 SKU。 最好從符合初始案例的最小 SKU 大小開始。 您也可以使用 Azure Advisor 建議將計算 SKU 優化。
您可以使用 定價計算機 ,根據工作負載和數據量來估計 Azure 數據總管叢集的價格。
提示
藉由購買保留,您可以預先支付叢集、叢集中所使用的虛擬機,以及一或三年的記憶體資源成本。 這些保留實例會個別購買,並可節省大量資金,以保護您的 Azure 數據總管叢集的最佳費率。 如需詳細資訊,請參閱 使用 Azure 數據總管保留容量預付 Azure 數據總管標記單位。
選取叢集類型
Azure 資料總管提供兩種類型的叢集:
- 生產環境 (含 SLA):生產叢集至少包含引擎叢集的兩個節點,以及數據管理叢集至少兩個節點。 這些叢集會在 Azure 數據總管 SLA 下運作。
- 開發/測試(無 SLA):開發/測試叢集包含引擎叢集的單一節點,以及數據管理叢集的單一節點。 這些叢集是成本最低的組態,因為它的實例計數較低。 此叢集設定沒有備援或 SLA。
開發與生產環境
開發叢集非常適合服務評估、設定擷取管線、進行概念證明(PoC)或案例驗證。 開發叢集與生產叢集之間的主要差異包括:
- 開發叢集的大小有限,且無法成長超過單一節點
- Azure 數據總管標記不會針對開發叢集收費
- 開發叢集沒有 SLA
計算 SKU 類型
Azure 數據總管叢集支援不同類型工作負載的各種 SKU。 每個 SKU 都會提供不同的 SSD 記憶體和 CPU 比率,以協助您正確調整部署大小,並為企業分析工作負載建置成本最佳的解決方案。
計算最佳化
- 提供高核心與快取比率,以及每個核心的最低成本。
- 低延遲 I/O 的本機 SSD。
儲存體最佳化
- 提供較大的記憶體,範圍從每個引擎節點 1 TB 到 4 TB,以及每 GB 的最低成本。
- 適用於需要大量數據記憶體的工作負載。
- 某些 SKU 會使用連結至引擎節點的進階記憶體 (PS),而不是本機 SSD。 存取 PS 的速度比本機 SSD 慢,因此具有 PS 的 SKU 成本更高,且效能比連結本機 SSD 的 SKU 低。
選取並優化您的計算 SKU
在叢集建立期間選取您的計算 SKU
當您建立 Azure 數據總管叢集時,請選取規劃工作負載的最佳 VM SKU。 使用下列屬性可協助您為環境選擇正確的 SKU:
屬性 | 詳細資料 |
---|---|
每 GB 的成本 | 計算優化的成本很高。 儲存體最佳化 SKU 的成本較低。 |
每個核心的成本 | 計算優化的成本較低。 記憶體優化 SKU 的成本很高。 |
RI 定價 | RI 折扣會依區域和 SKU 而有所不同。 |
注意
計算成本是叢集成本中最重要的部分。
最佳化您的叢集計算 SKU
若要將叢集計算 SKU 優化,請設定垂直調整並檢查 Azure Advisor 建議。
透過各種計算 SKU 選項可供選擇,您可以將案例的效能和熱快取需求的成本優化。 當查詢量很高時,請選擇計算優化的 SKU 以獲得最佳效能。 在查詢需要快取的大量數據時,選擇記憶體優化 SKU 以獲得最佳效能。
最好使用一些較大型 VM 的節點,這些節點會使用比許多較小的 VM 更多的 RAM。 某些查詢類型需要更多 RAM,這些查詢類型對 RAM 的需求較高,例如使用聯結的查詢。 因此,調整叢集時,建議您相應增加至較大的SKU,並視需要新增更多節點來相應放大。
注意
變更或相應增加叢集 SKU 可能會導致一到三分鐘的服務中斷。 查詢效能可能會在 SKU 移轉期間受到影響,影響的程度可能會因使用模式而有所不同。
SKU 可用性
SKU 可用性會根據下列因素而有所不同:
- 區域:並非所有區域或可用性區域都有可用的SKU。 如需詳細資訊,請參閱每個 SKU 頁面以取得區域可用性。
- 訂用帳戶:某些 SKU 可能僅適用於特定訂用帳戶類型。 如果您的訂用帳戶在符合業務需求的位置或區域中無法使用 SKU,請提交 SKU 要求以 Azure 支援。
SKU 選項
下列 SKU 系列適用於 Azure 數據總管叢集 VM。 計算和記憶體優化類別內的 SKU 系列會依建議順序進行排名。
記憶體優化
SKU 系列 | 可用的 vCPU 設定 | SKU 類型 | 支援進階記憶體 |
---|---|---|---|
Lasv3 | 8, 16 , 32 | AMD | No |
Lsv3 | 8, 16 , 32 | Intel | No |
Easv4、Easv5、ECadsv5 | 8, 16 | AMD | Yes |
Esv4、 Esv5 | 8, 16 | Intel | Yes |
DSv2 | 8, 16 | Intel | Yes |
計算最佳化
SKU 系列 | 可用的 vCPU 設定 | SKU 類型 | 支援進階記憶體 |
---|---|---|---|
Eadsv5、 ECadsv5 | 2, 4, 8, 16 | AMD | No |
Edv4、 Edv5 | 2, 4, 8, 16 | Intel | No |
Eav4 | 2, 4, 8, 16 | AMD | No |
Dv2 | 2, 4, 8, 16 | Intel | No |
注意
所有具有 2 個核心的計算優化 SKU 都可以設定為開發叢集。
建議只在使用非常大型 L16asv3/L16sv3 叢集達到 1000 個叢集節點限制的案例中,使用 L32asv3 / L32sv3,或具有極高並行要求速率的叢集。 ECasv5 和 ECadsv5 是機密運算 SKU。 如需詳細資訊,請參閱 機密運算 VM。 針對記憶體優化的 ECasv5 SKU,如果您使用 自己的客戶自控密鑰 (CMK),CMK 加密會在記憶體帳戶和進階記憶體磁碟上執行。
- 透過 Azure 資料總管計算和記憶體隔離,您可以從最佳的成本 SKU 開始,並在成熟使用模式或資料遺失之後移至另一個 SKU。
- 您可以使用 Azure 資料 總管 ListSkus API 來檢視每個區域的已更新計算 SKU 清單。
快取大小
Azure 資料總管會保留每個要用於叢集作業的 Azure 計算 SKU 規格中顯示的磁碟大小部分。 入口網站的 [SKU] 選取區段提供每個 SKU 的確切快取大小。
相關內容
- 瞭解如何使用 定價計算機