Azure 上 Red Hat Enterprise Linux 的商務持續性和災害復原考慮
本文說明如何改善 Azure 上 Red Hat Enterprise Linux (RHEL) 環境的商務持續性和災害復原 (BCDR) 整備程度。 它提供建議,可讓您用來支援 RHEL 工作負載,以及部署 RHEL 平臺管理元件。 Red Hat 管理訂用帳戶包含平台元件,可協助管理一或多個 RHEL 登陸區域中的工作負載。 這些元件提供自己的 BCDR 元件提供自己的 BCDR 元件。
設計考量
實作下列考慮,以改善 RHEL 工作負載的復原能力。
復原時間目標
復原時間目標 (RTO) 是您的系統在災害后復原到其原始狀態所需的時間量。 RTO 包含下列項目所需的時間:
- 將最少的功能還原至虛擬機(VM)和應用程式。
- 還原應用程式所需的數據。
在商務方面,RTO 代表商務程式服務不足的時間量。 低 RTO 非常適合 任務關鍵性工作負載 ,讓商務程式可以快速繼續。 對於優先順序較低的工作負載,較高的 RTO 對公司效能可能沒有明顯的影響。
恢復點目標
若要成功操作雲端環境,您必須實作備份、複寫或兩者,以保護數據免於失敗。 恢復點目標 (RPO) 是指上次擷取數據的時間。 當系統失敗時,您只能將它還原至最新的恢復點。
您可以從最近的恢復點測量 RPO,到發生中斷的時間。 如果您以小時為單位測量 RPO,系統失敗會導致最後一個恢復點與中斷之間的時數遺失數據。 如果您以天為單位測量 RPO,系統失敗會導致最後一個恢復點與中斷之間的天數遺失數據。 一天 RPO 理論上會導致當天導致失敗的所有交易遺失。
對於任務關鍵性系統,請以分鐘或秒為單位測量 RPO,以協助避免營收或利潤損失。 簡短的 RPO 通常會導致管理成本增加。 為了協助降低成本,您應該建立一個以最長可接受的 RPO 為重點的管理基準。 然後,您可以減少需要更多投資的特定平臺或工作負載的 RPO。
工作負載 BCDR 考慮
RHEL 型工作負載的高可用性和災害復原設計考慮取決於支持這些工作負載的技術。 許多新式工作負載可以利用原生 Azure 服務,跨可用性區域和跨區域提供備援。 使用 Azure 服務來管理資料復寫、自動調整可用性設定組,以及控制更新和容錯網域。 這些做法可讓您更輕鬆地確保 RHEL 部署的可用性。
資料庫解決方案和其他具狀態應用程式可能需要以操作系統為中心的解決方案,以提供高可用性和災害復原。 請洽詢應用程式開發人員或廠商,以驗證應用程式所支援的解決方案。 如需詳細資訊,請參閱 IaaS 應用程式的高可用性和災害復原。
Azure 功能或服務 | 定義 | 考量 |
---|---|---|
地區 | 一組彼此靠近的數據中心,以提供低網路延遲。 為了確保快速數據傳輸,特定區域網路會連線數據中心。 | 當您 選擇 Azure 區域時,請考慮資料中心、使用者和後端資料的位置。 檢查您在選取區域中所需的服務可用性。 針對 RHEL 部署,您可能有一個區域要啟動,然後您可以在未來針對 BCDR 用途新增更多區域。 |
Azure ExpressRoute | Azure 服務,可用來建立私人連線,從Microsoft數據中心到您自己的基礎結構或共置設施。 | ExpressRoute 會略過公用因特網,並提供專用的私人連線。 此設定是大規模 RHEL 部署的常見需求。 ExpressRoute 是共用服務,因此您必須仔細規劃頻寬容量,以符合企業的整體頻寬需求。 如果您有不足的頻寬,可能會危害用戶體驗,或存取數據中心內的重要服務。 請確定您以彈性的方式 跨區域和對等互連位置部署 ExpressRoute。 |
可用性區域 | 個別的數據中心群組,這些數據中心在 Azure 區域內有自己的電源、冷卻和網路系統。 可用性區域提供數據中心失敗的高可用性和復原能力。 | 若要確保 高服務等級協定 (SLA),請盡可能搭配 RHEL 基礎結構使用可用性區域。 可用性區域可在區域內提供數據中心備援。 但並非每個區域都有可用性區域,因此您必須仔細規劃。 RHEL 服務,例如 Azure Red Hat OpenShift 和登陸區域管理服務,都支援可用性區域。 |
可用性設定組 | VM 的邏輯群組。 至少一部 VM 一律會在計劃性或非計劃性維護事件期間啟動並執行。 容錯網域是可用性設定組的子集,可共用常見的實體基礎結構,例如電源或網路。 當您將 VM 分散到不同的容錯網域時,可用性設定組可減少硬體故障對 VM 可用性的影響。 | 可用性設定組提供 高 SLA。 當區域缺少可用性區域時,可用性設定組適用於 RHEL 基礎結構。 可用性設定組只有硬體備援,類似於 Hypervisor 反親和性規則。 因此,如果您的區域沒有可用性區域,您需要數據中心和地理備援的多區域策略。 |
Azure Load Balancer | 網路負載平衡服務。 您可以設定 Load Balancer,以跨多個 Red Hat Enterprise 伺服器有效率地提供大量網路流量。 此服務以低延遲和高輸送量運作,可改善應用程式的效能和可用性。 Load Balancer 可以根據需求自動調整。 為了提升應用程式的混合式部署,Load Balancer 可以將網路流量分散到 Azure 中的多個區域,也可以在內部部署環境和 Azure 之間散發。 |
Load Balancer 會將網路流量分散到多部伺服器,以提供不間斷的應用程式可用性,並防止單一點失敗。 如果發生災害,Load Balancer 會將流量重新導向至操作伺服器,以提供快速故障轉移和復原。 此作業可將停機時間降到最低,並維護商務作業。 Load Balancer 可以平衡內部部署伺服器到 Azure 雲端或多個 Azure 區域中伺服器之間的流量。 如需詳細資訊,請參閱 負載平衡選項。 |
受控磁碟 | Azure 管理的虛擬化磁碟。 您可以選擇磁碟大小和類型。 Azure 會將磁碟分散到各種記憶體單位,以保護您的數據免於硬體故障。 | 受控磁碟是所有 RHEL 基礎結構的最佳選擇。 請勿使用非受控磁碟。 如需詳細資訊,請參閱 VM 的 SLA。 不同類型的磁碟有不同的效能和成本。 針對 RHEL 基礎結構機器,我們建議使用 Azure 進階 SSD。 當您選擇磁碟類型時,請考慮成本、效能和可用性。 當您解除分配系統時,會移除本機 SSD 和暫時磁碟。 視需要備份這些磁碟上的數據。 |
Azure 備份 | 提供符合成本效益的解決方案來備份數據並從 Azure 雲端復原的服務。 | 備份是可靠且符合成本效益的解決方案,可保護您的 RHEL 基礎結構免於 VM 失敗或損毀。 使用備份輕鬆地從雲端還原整個 VM 或特定檔案和資料夾,而不需要重新建立 VM 或遺失任何數據。 您也可以使用其他支援的合作夥伴解決方案。 |
Azure Arc | 可擴充 Azure 服務的平臺,以便跨各種環境執行,包括數據中心、邊緣裝置和多重雲端架構。 使用 Azure Arc 為應用程式和服務提供一致的開發、作業和安全性管理。 | 使用 Azure Arc 來實作集中式自動化備份和監視,以從 BCDR 的觀點提升復原能力。 |
Azure Site Recovery | 提供災害復原功能以確保商務持續性的服務。 您可以跨不同區域復寫和管理工作負載,包括 Azure VM 和內部部署 VM。 使用 Site Recovery,您可以設定複寫、故障轉移和復原程式,以保護應用程式在計劃性中斷和非計劃性中斷期間。 | 使用 Site Recovery 將復原問題降到最低、降低基礎結構成本,並確保 Azure 區域或從內部部署位置到 Azure 之間的安全且可靠的復原。 |
資源鎖定 | 您可以用來限制組織中使用者和角色的 Azure 功能。 保護您的重要資源免於意外或惡意變更。 您可以在各種範圍層級鎖定資源,例如訂用帳戶、資源群組或個別資源層級。 視鎖定類型而定,您可以防止使用者刪除或修改資源,但他們仍然可以讀取其設定。 | 若要保護所有 RHEL 基礎結構和黃金映像 VM,請使用資源鎖定。 若要防止意外遺失重要機器,請至少套用 刪除 鎖定。 將 ReadOnly 鎖定套用至 RHEL 基礎結構機器,因為它們不會經常變更。 只在適當的變更控制窗口期間進行變更。 |
RHEL 平臺BCDR考慮
如需 RHEL 平台基礎結構 BCDR 功能的詳細資訊,請參閱:
設計建議
針對 Linux 容器中的雲端原生應用程式,請使用以 Kubernetes 為基礎的平臺,以確保延展性、高可用性和備援性。 請考慮使用 Azure Red Hat OpenShift 平臺或具有複寫或異地復寫記憶體的自我管理 OpenShift 部署。
針對原生 Web 應用程式前端和無狀態應用程式,您可以使用許多提供應用程式可用性的 Azure 原生服務。 如需使用這類服務的架構,請參閱:
上述架構會針對可用性區域使用各種 Azure 服務。 多區域架構會使用內容和 Azure Front Door 的異地複寫功能作為負載平衡服務。
對於許多需要高可用性的傳統具狀態應用程式,RHEL 提供 Pacemaker 高可用性附加元件。 您可以從 Azure Marketplace 取得具有此功能的系統,或部署內嵌必要軟體元件的自定義映像。 如需詳細資訊,請參閱 在 Microsoft Azure 上設定 Red Hat 高可用性叢集。
可用性問題會影響服務中斷和服務回應時間。 可能會發生服務降低,這可能會降低客戶的服務體驗。 若要確保您在必要區域內維持效能等級和足夠的容量,請使用 Azure 隨選容量保留 功能。
可靠性
許多適用於基礎結構即服務 VM 基礎結構的概念也適用於 RHEL 架構。 如需詳細資訊,請參閱 可靠性設計原則。
叢集
Azure 不支援在單一 RHEL Pacemaker 叢集中整合應用程式伺服器中央服務和資料庫高可用性。 若要解決這項限制,請將它們分成個別叢集。 您可以在一對 VM 中結合最多 五個中央服務叢集 。
針對 SAP 上的 BCDR,請考慮下列服務來執行 SAP 中央服務叢集:
- RHEL Pacemaker 叢集:不支援 STONITH 封鎖裝置,但您可以依賴 Azure 柵欄代理程式。
- SAP 認證的非Microsoft叢集軟體:如果此選項符合您的需求,請瀏覽此選項。
根據您的特定需求和作業系統選擇適當的服務。
如需詳細資訊,請參閱
- 在 Microsoft Azure 上為 RHEL 9 設定 Red Hat 高可用性叢集。
- 設定和管理 RHEL 9 的高可用性叢集。
- RHEL 8 檔。
Azure 計算資源庫複本
您可以使用計算資源庫來儲存用於部署的黃金映像。 使用這些映像進行應用程式和工具的災害復原。 計算資源庫可以在支援可用性區域的區域中,搭配區域備援記憶體 (ZRS) 帳戶使用高可用性資源。 ZRS 提供針對區域性失敗的復原能力。 您也可以將資源庫映像複寫至其他區域或地理位置。
注意
我們建議您在不同的區域中至少有兩個資源庫。
Site Recovery
Site Recovery 可以增強某些 RHEL 元件的復原能力。 如需支援的 RHEL 月臺復原伺服器清單,請參閱 使用 Site Recovery 進行 Azure VM 災害復原的支援矩陣。 您也可以將 Site Recovery 設定為 從內部部署環境故障轉移至雲端的故障轉移。 若要取得 Site Recovery 成本的估計值,請使用 Site Recovery 部署規劃工具。
復原叢集節點
若要減少 RTO 並增加復原能力,您可以使用作用中或待命遠端 復原叢集 節點。 您必須手動設定災害復原叢集專案。 例如,您必須套用設定來設定資源和複製數據。