共用方式為


災害復原容錯移轉程序

重要

本文不可取代 SAP HANA 管理說明文件或 SAP 附註。 本文預期您對於 SAP HANA 管理和操作有深入的了解和專業知識,尤其是備份、還原、高可用性和災害復原 (DR) 方面。 本文中會顯示 SAP HANA Studio 的螢幕擷取畫面。 SAP 管理工具和工具本身的畫面內容、結構和性質,可能會因 SAP HANA 的版本而異。

在本文中,我們將逐步解說在 Azure 上的 SAP HANA 大型執行個體 (也稱為裸機基礎結構) 容錯移轉至 DR 站台的步驟。

容錯移轉案例和選項

容錯移轉至災害復原網站時,須考量兩種情況:

  • 您需要將 SAP HANA 資料庫恢復到最新的資料狀態。 在這種情況下,您可以使用自助服務指令碼來執行容錯移轉,無需連絡 Microsoft。 對於容錯回復,您需要與 Microsoft 合作。
  • 您可以還原至非最新複寫快照集的儲存體快照集。 在此情況下,您需要與 Microsoft 合作。

注意

下列步驟必須在 DR 站台中的 HANA 大型執行個體單位上執行。

若要還原至最新複寫的儲存體快照集,請依照 Microsoft snapshot tools for SAP HANA on Azure 中「Perform full DR failover - azure_hana_dr_failover」的步驟進行。

如果您想要容錯移轉多個 SAP HANA 執行個體,請多次執行 azure_hana_dr_failover 命令。 執行要求時,輸入您想要容錯移轉及還原的 SAP HANA SID。

您可以在不影響實際複寫關係的情況下,測試災害復原容錯移轉。 若要執行測試容錯移轉,請依照 適用於 Azure 上 SAP HANA 的 Microsoft 快照集工具 (英文) 中「執行測試容錯移轉 - azure_hana_test_dr_failover」的步驟進行。

重要

請勿透過測試容錯移轉的流程,在您於災害復原網站建立的執行個體上執行任何實際交易。 azure_hana_test_dr_failover 命令會建立一組與主要站台沒有任何關聯的磁碟區。 如此一來,「不」可能同步回主要站台。

如果您想要測試多個 SAP HANA 執行個體,請多次執行此指令碼。 執行要求時,輸入您想要測試容錯移轉的執行個體 SAP HANA SID。

將 DR 磁碟區設為先前的快照集

假設您需要容錯移轉至災害復原網站,以救回幾小時前刪除的資料,且需要將災害復原磁碟區設為較早的快照集。 則可使用下列程序:

  1. 在目前執行的 HANA 大型執行個體 DR 上,關閉非生產的 HANA 執行個體。 休眠的 HANA 生產執行個體已預先安裝。

  2. 確定沒有任何 SAP HANA 程序處於執行狀態。 請使用下列命令進行這項檢查:

    /usr/sap/hostctrl/exe/sapcontrol –nr <HANA instance number> - function GetProcessList.

    您應該會從輸出中看到 hdbdaemon 程序處於已停止狀態,而且已沒有其他 HANA 程序處於執行中或已啟動狀態。

  3. 決定要讓災害復原網站還原到哪個快照集名稱或 SAP HANA 備份識別碼。 在真實的災害復原案例中,此快照集通常會是最新的快照集。 如果您需要復原遺失的資料,請挑選較早的快照集。

  4. 透過高優先順序的支援要求連絡 Azure 支援。 提供快照集名稱和日期,要求還原該快照集。 您也可以透過 DR 站台上的 HANA 備份識別碼來識別它。 預設值僅供作業端進行還原 /hana/data 磁碟區之用。 如果也想要有 /hana/logbackups 磁碟區,則需要特別指明。 請勿還原 /hana/shared 磁碟區。 而是在針對 PRD 重新掛接 /hana/shared 之後,改為選擇特定的檔案,例如 .snapshot 目錄及其子目錄中的 global.ini。

    Microsoft 作業會採取下列步驟:

    a. 停止將快照集從生產磁碟區複寫至災害復原磁碟區。 如果生產站點中斷是導致災害的原因,則此中斷可能已經發生。

    b. 在災害復原磁碟區上還原儲存體快照集名稱或具有您所選備份識別碼的快照集。

還原後,災害復原磁碟區即可供掛接到 DR 區域中的 HANA 大型執行個體。

  1. 將災害復原磁碟區掛接至災害復原網站中的 HANA 大型執行個體單位。
  2. 啟動休眠的 SAP HANA 生產執行個體。
  3. 假設您選擇複製交易記錄之備份記錄,以減少復原點目標 (RPO) 時間。 然後將交易記錄備份合併至新掛接的 DR /hana/logbackups 目錄。 請勿覆寫現有的備份。 請複製未隨著儲存體快照集的最新複寫一起複寫的較新備份。
  4. 您也可以從未複寫到 DR Azure 區域中 /hana/shared/PRD 磁碟區的快照集還原單一檔案。

復原 SAP HANA 生產執行個體

下列步驟說明如何從所還原的儲存體快照集和可用的交易記錄備份來復原 SAP HANA 生產執行個體。

  1. 使用 SAP HANA Studio,將備份位置變更為 /hana/logbackups

    變更災害復原的備份位置

  2. SAP HANA 會掃描所有備份檔案位置,並建議可作為還原目的地的最新交易記錄備份。 掃描可能需要幾分鐘的時間,完成後會出現如下所示的畫面:

    災害復原的交易記錄備份清單

  3. 調整某些預設設定:

    • 清除 [使用差異備份]。
    • 選取 [初始化記錄區域]。

    設定初始化記錄區域

  4. 選取 [完成] 。

    完成 DR 還原

此時應該會出現進度視窗,如下所示。 請記住,這是具有 3 節點相應放大 SAP HANA 組態的災害復原還原範例。

還原進度

如果還原作業在 [完成] 畫面停止回應,而且未顯示進度畫面,請確認背景工作角色節點上的所有 SAP HANA 執行個體是否正在執行。 如有必要,請手動啟動 SAP HANA 執行個體。

從 DR 容錯回復到生產網站

您可以從 DR 站台容錯回復到生產網站。 讓我們看看以下情況:因為生產 Azure 區域發生問題而容錯移轉至 DR 站台,而不是因為您需要復原遺失的資料。

您已在災害復原網站中執行您的 SAP 生產工作負載一段時間。 由於生產網站中的問題已經解決,因此您想容錯回復到生產網站。 因為您不能遺失資料,所以退回生產網站的作業會涉及許多步驟,並且要與 SAP HANA on Azure 營運小組密切合作。 在問題獲得解決之後,由您決定是否觸發營運小組來開始反向同步處理到生產網站的程序。

請遵循下列步驟:

  1. Azure 上的 SAP HANA 營運小組取得觸發程序,以從 DR 存放磁碟區 (目前代表生產狀態) 同步處理生產存放磁碟區。 處於此狀態時,生產網站中的 HANA 大型執行個體會關閉。
  2. SAP HANA on Azure 營運小組會監視複寫程序,並確保能趕上通知您的時間。
  3. 您會關閉使用災害復原網站中生產 HANA 執行個體的應用程式。 接著執行 HANA 交易記錄備份。 然後請停止在災害復原網站中 HANA 大型執行個體上執行的 HANA 執行個體。
  4. 現在,作業小組會再次手動同步處理磁碟區。
  5. SAP HANA on Azure 營運小組會再次啟動生產網站中的 HANA 大型執行個體。 營運小組會將它轉交給您。 請確定在您啟動 HANA 大型執行個體時,SAP HANA 執行個體已關閉。
  6. 您可執行和先前容錯移轉至 DR 站台時所執行的相同資料庫還原步驟。

監視災害復原複寫

若要監視儲存體複寫進度的狀態,請執行指令碼 azure_hana_replication_status。 必須從於災害復原位置執行的單位來執行此命令,才可如預期般運作。 無論複寫是否為作用中,此命令都可以運作。 您可以對 DR 位置中的租用戶所具有的每個 HANA 大型執行個體執行這個命令。 但不能用來取得開機磁碟區的詳細資料。

如需有關命令及其輸出的詳細資訊,請參閱 Microsoft snapshot tools for SAP HANA on Azure 中的「Get DR replication status - azure_hana_replication_status」。

後續步驟

了解如何在 Azure 上監視 SAP HANA (大型執行個體)。