使用 Azure 備份計量監視備份的健康情況 (預覽版)
Azure 備份透過 Azure 監視器提供一組內建計量,讓您監視備份的健康情況, 並讓您設定在計量超過定義的閾值時,觸發的警示規則。
Azure 備份提供下列重要功能:
- 能夠檢視與備份項目的備份和還原健康情況相關的現成計量,以及相關聯的趨勢
- 能夠撰寫與這些計量相關的自訂警示規則,以有效率地監視備份項目的健康情況
- 能夠將引發的計量警示路由傳送至 Azure 監視器支援的不同通知通道,例如電子郵件、ITSM、Webhook、邏輯應用程式等。
支援的案例
支援下列工作負載類型的內建計量:
- Azure VM、Azure VM 中的 SQL 資料庫
- Azure VM 中的 SAP HANA 資料庫
- Azure 檔案
- Azure Blob。
目前不支援 HANA 執行個體工作負載類型的計量。
您可以一次檢視各區域和訂閱所有的復原服務保存庫計量。 目前不支援在 Azure 入口網站中檢視較大範圍的計量。 相同的限制也適用於設定計量警示規則。
支援的計量
Azure 備份目前支援下列計量:
備份健康情況事件:此計量的值代表備份作業健康情況相關的健康情況事件計數,即特定期間內保存庫所引發的事件。 備份作業完成後,Azure 備份服務會建立備份健康情況事件。 根據作業狀態 (例如,成功或失敗),事件相關的維度會有所不同。
還原健康情況事件:此計量的值代表還原作業健康情況相關的健康情況事件計數,即特定期間內保存庫所引發的事件。 還原作業完成後,Azure 備份服務會建立還原健康情況事件。 根據作業狀態 (例如,成功或失敗),事件相關的維度會有所不同。
注意
由於備份會持續進行,但這裡沒有備份作業的概念,因此我們僅支援 Azure Blob 工作負載的「還原健康情況事件」。
根據預設,計數會顯示在保存庫層級。 若要檢視特定備份項目和作業狀態的計數,您可以在任何支援的維度上篩選計量。
下表列出備份健康情況事件和還原健康情況事件計量支援的維度:
維度名稱 | 說明 |
---|---|
資料來源識別碼 | 與作業相關聯的資料來源的唯一識別碼。
如果是 SQL AG 資料庫備份,資料來源識別碼欄位即是空的,因為這類案例中沒有資料來源 (VM)。 若要檢視 AG 中特定資料庫的計量,請使用備份執行個體識別碼欄位。 |
資料來源類型 | 與作業相關聯的資料來源類型。 以下是支援的資料來源類型:
|
備份執行個體識別碼 | 與作業相關聯備份執行個體的 ARM 識別碼。 例如, /subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM |
備份執行個體名稱 | 備份執行個體的易記名稱 (以方便閱讀)。 名稱格式是 {protectedContainerName};{backupItemFriendlyName} 。 例如, testStorageAccount;testFileShare |
健全狀態 | 代表作業完成後備份項目的健康情況。 健康情況會採用下列其中一個值:良好、狀況不良、持續狀況不良、暫時性降級、持續性降級。
|
在 Azure 入口網站中檢視計量
若要檢視 Azure 入口網站中的計量,請遵循下列步驟:
在 Azure 入口網站 中,移至商務持續性中心>監視 + 報告>計量。
或者,您可以移至 復原服務保存庫 或 Azure 監視器,然後選取 [計量]。
若要篩選計量,請選取下列資料類型:
- Scope
- 訂用帳戶 (一次只能選取 1 個)
- 復原服務保存庫備份保存庫/ 作為資源類型
- 地點
注意
- 如果您從復原服務保存庫備份保存庫/ 移至 [計量],則會預先選取計量範圍。
- 選取復原服務保存庫備份保存庫/ 作為資源類型,可讓您追蹤備份相關的內建計量 - 備份健康情況事件和還原健康情況事件。
- 目前,檢視計量的範圍適用於特定訂用帳戶和區域中的所有復原服務保存庫。 例如,TestSubscription1 中美國東部的所有復原服務保存庫。
選取您要檢視計量的保存庫或保存庫群組。
您目前可以檢視計量的最大範圍是:特定訂閱和區域的所有復原服務保存庫。 例如,TestSubscription1 中美國東部的所有復原服務保存庫。
選取計量即可檢視備份健康情況事件或還原健康情況事件。
此計量會以圖表的方式呈現,顯示保存庫的健康情況事件計數。 您可以使用畫面頂端的篩選器,調整時間範圍和彙總細微性。
若要根據不同維度篩選計量,請按一下 [新增篩選條件] 按鈕,然後選取相關的維度值。
- 例如,如果您只要查看 Azure VM 備份的健康情況事件計數,請新增篩選條件
Datasource Type = Microsoft.Compute/virtualMachines
。 - 若要檢視保存庫中特定資料來源或備份執行個體的健康情況事件,請使用資料來源識別碼/備份執行個體識別碼篩選。
- 若只要檢視失敗的備份健康情況事件,請選取對應狀況不良或降級健康情況狀態的值,即可使用 HealthStatus 上的篩選器。
- 例如,如果您只要查看 Azure VM 備份的健康情況事件計數,請新增篩選條件
管理警示
若要檢視引發的計量警示,請遵循下列步驟:
- 在 Azure 入口網站 中,移至商務持續性中心>監視 + 報告>警示。
- 篩選 [訊號類型] = [計量],且 [警示類型] = [已設定]。
- 按一下警示,檢視更多警示的詳細資料,並變更其狀態。
注意
警示有兩個欄位 - 監視條件 (已引發/已解析) 和警示狀態 (新增/認可/已關閉)。
- 警示狀態:您可以編輯此欄位(如以下螢幕快照所示)。
- 監視條件:您無法編輯此欄位。 此欄位多用於服務會自行解析警示的案例。 例如,計量警示中的自動解析行為使用監視條件欄位解析警示。
資料來源和全域警示
根據警示規則設定,引發的警示會出現在商務持續性中心的 [警示] 刀鋒視窗上。
注意
目前而言,若為 blob 還原警示,則只有在建立警示規則的情況下,同時選取 datasourceId 和 datasourceType 維度,才會在資料來源警示下顯示警示。 如果未選取任何維度,警示會出現在全域警示底下。
以程式設計方式存取計量
您可以使用不同的程式設計用戶端 (例如 PowerShell、CLI 或 REST API) 存取計量功能。 如需詳細資料,請參閱 Azure 監視器 REST API 文件。
範例警示案例
如果保存庫的所有已觸發備份在過去 24 小時內成功,則會引發單一警示
警示規則:如果過去 24 小時的備份健康情況事件為 < 即引發警示:
Dimensions["HealthStatus"] != "Healthy"
在每次失敗的備份作業之後引發警示
警示規則:如果過去 5 分鐘的備份健康情況事件為 > 即引發警示:
- Dimensions["HealthStatus"]!= "Healthy"
- Dimensions["DatasourceId"]= "所有的目前值和失敗值"
在過去 24 小時內針對相同項目連續備份失敗時引發警示
警示規則:如果過去 24 小時的備份健康情況事件為 > 即引發警示:
- Dimensions["HealthStatus"]!= "Healthy"
- Dimensions["DatasourceId"]= "所有的目前值和失敗值"
如果未在過去 24 小時內執行項目的備份作業,則引發警示
警示規則:如果過去 24 小時的備份健康情況事件為 < 1 即引發警示:
Dimensions["DatasourceId"]= "所有的目前值和失敗值"