共用方式為


使用經常性存取窗口查詢冷數據

經常性存取視窗可讓您有效率地查詢冷數據,而不需要匯出數據或使用其他工具。 當非經常性數據大小很大,且相關數據來自過去的任何時間時,請使用經常性視窗。 經常性存取視窗定義於快取原則中。

Azure 數據總管會將其數據儲存在可靠的長期記憶體中,並在叢集節點上快取此數據的一部分。 快取原則會控管快取的數據。 快取的數據會 被視為經常性存取,而其餘的數據則視為 非經常性存取。

若要查詢非經常性數據,Azure 數據總管會處理載入步驟,其需要存取比本機磁碟高得多延遲的儲存層。 當查詢限制為小型時間範圍時,通常稱為「時間點」查詢時,擷取的數據量通常很小,而且查詢會快速完成。 例如,鑑識分析過去一天查詢遙測屬於此類別。 查詢持續時間的影響取決於從記憶體提取的數據大小,而且可能相當重要。 如果您要掃描大量的非經常性數據,查詢效能可能會受益於使用經常性視窗。

本文件說明如何使用經常性存取視窗來查詢冷數據。

必要條件

在叢集上設定自動調整

變更快取原則之後,叢集會自動快取其磁碟上的相關數據。 您必須調整叢集,以容納新快取定義所需的額外磁碟。 建議您設定叢集以使用 優化自動調整 設定。

  1. 在 Azure 入口網站 中,移至您的 Azure 數據總管叢集資源。 在 [設定] 底下,選取 [相應放大]。

  2. 在 [ 相應放大 ] 視窗中,選取 [優化自動調整]。

  3. 選取最小實例計數和實例計數上限。 叢集會根據負載,在這兩個數字之間自動調整範圍。

  4. 選取儲存

    優化的自動調整方法。

現在,您可以在使用經常性視窗期間預期最佳效能。

設定經常性視窗

經常性存取視窗是快取原則命令語法的一部分,並使用 命令進行設定.alter policy caching

注意

最多可能需要一小時的時間,才能根據更新的快取原則定義,完整更新叢集磁碟快取。

  1. 使用 .show policy caching 命令記下初始快取原則。

    .show table MyDatabase.MyTable policy caching 
    
  2. 使用下列語法改變快取原則。 單一資料庫或數據表可能會定義數個經常性視窗。

    .alter <entity_type> <database_or_table_or_materialized-view_name> policy caching 
          hot = <timespan> 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          ...
    

    其中:

    • from:作用中視窗的開始時間 (datetime)
    • to:熱視窗的結束時間 (datetime)

    例如,在下列設定下執行的查詢會檢查過去 14 天的數據,以及保留三年的數據。

    .alter table MyTable policy caching 
            hot = 14d,
            hot_window = datetime(2021-01-01) .. datetime(2021-02-01),
            hot_window = datetime(2021-04-01) .. datetime(2021-05-01)
    

執行查詢

在作用中視窗指定的期間內,執行您想要的查詢或查詢。

還原設定

  1. 使用在 [設定作用中 ] 視窗中擷取的原始快取設定
  2. 使用 .alter policy caching 命令,將快取原則還原為原始設定。

由於您已針對該叢集設定優化的自動調整,因此叢集會縮減成其原始大小。