開發商務持續性和災害復原計劃

已完成

貴組織需要您為應用程式設計站台復原策略。 首先,應了解針對混合式環境建立站台復原的特定需求。 您也必須了解 Azure 中有哪些工具可提供協助。

在此單元中,您要了解如何識別主要基礎結構、復原時間目標 (RTO) 和復原點目標 (RPO)。 以及哪些需求可能與您所使用的任何平台即服務 (PaaS) 相關。 您也會學習如何規劃備份和災害復原。 最後,您會探索一些可協助您建置站台復原解決方案的 Azure 功能。

商務持續性和災害復原

您必須開發 BCDR 計劃,以設計適當的站台復原解決方案。 BCDR 指的是一個程序,可協助您在發生重大事件之後,將應用程式還原至正常運作的狀態。 此事件可能是自然災害,例如地震。 或者,其本質上可能是技術性,例如刪除資料庫。 這些事件通常在範圍上更廣泛,而且需要付出更多努力才能復原。

若要策畫成功的災害復原程序,您必須先評估任何潛在失敗會帶來哪些種類的商務影響。 請盡可能考量將復原程序自動化。 災害復原程序某些部分不可避免地會牽涉到人工輸入,因此必須完整記載此程序。 您也必須定期模擬災害,讓復原程序保持有效。

識別重要專案關係人和基礎結構

識別在您的剩餘運作應用程式中有關係的任何人。 這些專案關係人可以是外部或內部使用者。 您的支援人員 (以及需要在 BCDR 程序中進行手動輸入的任何人) 是專案關係人。 依賴應用程式的其他應用程式和服務,也可以是專案關係人。

識別用來為應用程式撰寫環境的基礎結構。 此基礎結構通常是虛擬機器 (VM)、網路資源、儲存體資源,以及與這些資源一起執行的任何其他服務。

識別復原點目標和復原時間目標

RPO 代表如果發生災害,您的應用程式可接受多少資料遺失。 例如,如果您的應用程式當機,則可能會發現它只能接受執行復原之後半小時內的資料。 有些應用程式可以與較舊的資料搭配運作,但是對其他應用程式而言,一定要盡可能執行最新的資料。

RTO 是您的應用程式可接受的停機時間上限。 例如,您可能無法接受應用程式停機超過四個小時,因為企業可能隨著長時間中斷而遭受損失。 重要的應用程式需要更短的 RTO。

圖表將 RPO 顯示成遺失資料,將 RTO 顯示為從災害復原的時間。

合約或法規需求可能會經常影響您應用程式的 RPO 和 RTO。 RPO 和 RTO 也可能會因應用程式而異。 較不重要的應用程式可能會有較大的 RPO 和 RTO 值,而商務關鍵性應用程式可能會有較小的停機時間和資料遺失容錯。 您可以根據組織對風險的了解,以及因停機和資料遺失而產生的成本,計算 RTO 和 RPO。

識別任何 PaaS 需求

雖然您可能會控制您所管理應用程式的停機時間和復原,但您對 PaaS 服務可能沒有相同的控制權。 您使用的任何 PaaS 服務,都可能有自己的可用性保證,以及您必須在 BCDR 計劃中考慮的復原計劃。

識別並清查您相依的服務,以便將其復原功能納入 BCDR 計劃中。 請務必了解相關的需求,以及其對 BCDR 程序的影響。

Azure Site Recovery

Azure Site Recovery 是一項服務,可為您在 Azure、內部部署及其他雲端提供者中的應用程式提供 BCDR 功能。 Site Recovery 有可協助自動化災害復原的計劃。 其可讓您定義機器容錯移轉的方式,以及在成功容錯移轉之後將其重新啟動的順序。 如此一來,Site Recovery 可協助自動化工作,並進一步減少 RTO。 您也可以使用 Site Recovery 定期測試容錯移轉與復原處理序的整體效率。

圖表顯示 Azure Site Recovery 在將位於美國東部區域的三部虛擬機器上的工作負載複寫到美國西部區域時所扮演的角色。

資料備份

備份有助於保護應用程式不會意外刪除或損毀資料。 備份在任何 BCDR 計劃中扮演著重要的角色。

您的 RPO 取決於定期執行備份程序的頻率和方式。 例如,如果您已將備份程序設定為每兩個小時執行一次,而且在下一次備份五分鐘之前經歷災害,您將會遺失一小時 55 分鐘的資料。 讓備份更頻繁,表示您可以達到較低的 RPO。 在您的整體計劃中,您必須包含詳細的備份程序。

您可以將 Azure 備份用於備份程序。 Azure 備份服務可為所有由 Azure 所管理的資料資產提供安全的備份。 它使用零基礎結構解決方案來啟用自助式備份及還原,並以可預測的成本進行大規模管理。

Azure 備份為 Azure 與內部部署 VM 提供特殊化備份解決方案。 Azure 備份也可讓在 Azure VM 中執行的 SQL Server 或 SAP Hana 等工作負載擁有企業級備份及還原選項。

Azure 備份與 Azure Site Recovery 的目標是為了讓系統對於錯誤與失敗更有彈性。 不過,Azure 備份的主要目標是要維護允許您及時返回的具狀態資料複本。 Site Recovery 幾乎及時地複寫資料,並允許容錯移轉。 深入了解 Azure 備份

Azure 恢復功能

Azure 提供的數個功能可協助您確保應用程式和基礎結構具有復原性。 Azure 復原功能包括區域配對、可用性設定組和可用性區域。

區域配對

所有 Azure 區域都會與另一個區域配對。 在區域配對中,區域一律不會同時更新。 相反地,其會逐一更新。 如果某個區域發生問題,配對中的另一個區域就會變為可用。

這些區域配對也會用於複寫。 系統會複寫儲存體服務和許多 PaaS 服務,並在配對的區域中具有容錯移轉配對。 在規劃 BCDR 時,請務必使用區域配對,以利用其所提供的隔離。 您可減少從失敗復原所需的時間,並增加可用性。

可用性設定組

可用性設定組是 Azure 中的邏輯群組功能。 您可以將 VM 資源放在可用性設定組內,以確保這些 VM 資源在 Azure 資料中心內部署時彼此隔離。 可用性設定組是由「更新網域」與「容錯網域」組成。

圖表顯示可用性設定組中的更新網域和容錯網域。

更新網域有助於確保當 Azure 資料中心內的 VM 主機需要停機進行維護時,仍有一部分的應用程式伺服器會保持執行狀態。 大部分 VM 主機的更新都可以在不會影響其中所執行 VM 的情況下執行,但有時候無法執行這種類型的更新。

為了確保所有 VM 不會同時進行更新,Azure 資料中心會依邏輯分成多個更新網域。 若發生這類維護事件,例如必須對主機套用效能更新和重大安全性修補程式,維護事件會在這些更新網域中循序進行更新。 透過更新網域來使用循序更新,可確保整個資料中心不會在平台更新與修補期間變得無法使用。

容錯網域代表資料中心的實體區段,有助於確保可用性設定組中的伺服器具有機架多樣性。 容錯網域會與資料中心內共用硬體的實體區隔一致。 共用硬體包括伺服器機架上用於支援實體伺服器的電源、冷卻系統與網路硬體。

如果支援伺服器機架的硬體變得無法使用,則中斷只會影響該伺服器機架。 當您將 VM 放在可用性設定組時,其會自動分散到多個容錯網域。 如果發生硬體失敗,其只會影響部分 VM。

可用性區域

可用性區域是某個區域中的獨立實體資料中心位置。 可用性區域包括自己的電源、冷卻和網路功能。 當您在部署資源時,若將可用性區域納入考量,即有助於工作負載免於遭受資料中心中斷影響,又可在區域中保持存在。

區域性服務是可供您部署到區域內特定區域的服務 (例如虛擬機器)。 其他服務則為「區域備援服務」,會複寫到特定 Azure 區域中的所有可用性區域。 這兩種類型都有助於確保 Azure 區域內沒有單一失敗點。

圖表顯示三個可用性區域,其中一個失敗,但不影響到其他兩個。

檢定您的知識

1.

Azure 備份與 Azure Site Recovery 有何差異?

2.

有哪些 Azure 功能對於虛擬機器的高可用性有貢獻?