使用經常性存取窗口查詢冷數據
經常性存取視窗可讓您有效率地查詢冷數據,而不需要匯出數據或使用其他工具。 當非經常性數據大小很大,且相關數據來自過去的任何時間時,請使用經常性視窗。 經常性存取視窗定義於快取原則中。
Azure 數據總管會將其數據儲存在可靠的長期記憶體中,並在叢集節點上快取此數據的一部分。 快取原則會控管快取的數據。 快取的數據會 被視為經常性存取,而其餘的數據則視為 非經常性存取。
若要查詢非經常性數據,Azure 數據總管會處理載入步驟,其需要存取比本機磁碟高得多延遲的儲存層。 當查詢限制為小型時間範圍時,通常稱為「時間點」查詢時,擷取的數據量通常很小,而且查詢會快速完成。 例如,鑑識分析過去一天查詢遙測屬於此類別。 查詢持續時間的影響取決於從記憶體提取的數據大小,而且可能相當重要。 如果您要掃描大量的非經常性數據,查詢效能可能會受益於使用經常性視窗。
本文件說明如何使用經常性存取視窗來查詢冷數據。
必要條件
- 如果您沒有 Azure 訂用帳戶,請在開始前建立免費 Azure 帳戶。
- 建立 Azure 數據總管叢集和資料庫。
- 使用 Azure 數據總管數據擷取概觀中所述的其中一種方法擷取叢集中的數據。
在叢集上設定自動調整
變更快取原則之後,叢集會自動快取其磁碟上的相關數據。 您必須調整叢集,以容納新快取定義所需的額外磁碟。 建議您設定叢集以使用 優化自動調整 設定。
在 Azure 入口網站 中,移至您的 Azure 數據總管叢集資源。 在 [設定] 底下,選取 [相應放大]。
在 [ 相應放大 ] 視窗中,選取 [優化自動調整]。
選取最小實例計數和實例計數上限。 叢集會根據負載,在這兩個數字之間自動調整範圍。
選取儲存。
現在,您可以在使用經常性視窗期間預期最佳效能。
設定經常性視窗
經常性存取視窗是快取原則命令語法的一部分,並使用 命令進行設定.alter policy caching
。
注意
最多可能需要一小時的時間,才能根據更新的快取原則定義,完整更新叢集磁碟快取。
使用
.show policy caching
命令記下初始快取原則。.show table MyDatabase.MyTable policy caching
使用下列語法改變快取原則。 單一資料庫或數據表可能會定義數個經常性視窗。
.alter <entity_type> <database_or_table_or_materialized-view_name> policy caching hot = <timespan> [, hot_window = datetime(*from*) .. datetime(*to*)] [, hot_window = datetime(*from*) .. datetime(*to*)] ...
其中:
from
:作用中視窗的開始時間 (datetime)to
:熱視窗的結束時間 (datetime)
例如,在下列設定下執行的查詢會檢查過去 14 天的數據,以及保留三年的數據。
.alter table MyTable policy caching hot = 14d, hot_window = datetime(2021-01-01) .. datetime(2021-02-01), hot_window = datetime(2021-04-01) .. datetime(2021-05-01)
執行查詢
在作用中視窗指定的期間內,執行您想要的查詢或查詢。
還原設定
- 使用在 [設定作用中 ] 視窗中擷取的原始快取設定。
- 使用
.alter policy caching
命令,將快取原則還原為原始設定。
由於您已針對該叢集設定優化的自動調整,因此叢集會縮減成其原始大小。