優化商務持續性和災害復原
當您將 Oracle 資源遷移至 Azure 時,請考慮資料庫的可靠性,以及虛擬機(VM)、虛擬網路子網和記憶體元件上層的可靠性。
Azure 基礎結構即服務上的 Oracle(IaaS) 可以滿足最需求 Oracle 工作負載所需的復原目標。 若要有效地使用本文中的指引,請先根據您的業務需求定義復原關鍵效能指標(KPI)。 使用您的復原時間目標 (RTO) 和恢復點目標 (RPO) 需求作為基準 KPI,以判斷 Azure 上 Oracle 工作負載的最佳架構。
RTO 是應用程式在災害、失敗或可比較事件之後仍無法使用的最大時間量。
RPO 是災害、失敗或可比較事件之後的數據遺失量上限。
數據保護的備份方法
Azure IaaS 上 Oracle 工作負載的三種 Oracle 資料庫備份方法包括:
串流備份。 針對此方法使用 Oracle 復原管理員 (RMAN)。 RMAN 會將備份串流至循序磁帶媒體。
Azure 上的備份目的地包括:
- 您可以在 Azure Marketplace 中找到的非Microsoft虛擬磁帶媒體櫃。
- 本機和遠端檔案共用,例如使用網路文件系統通訊協定、Azure 檔案儲存體 和 Azure NetApp Files Azure Blob 儲存體。
記憶體層級快照集。 針對此方法使用 Azure 備份。 此方法依賴您用於資料庫檔案的記憶體類型。 例如,如果您使用 Azure 受控磁碟,例如 Azure 進階 SSD,Azure 備份 與 Oracle 資料庫整合。 如果您使用 Azure NetApp Files,您可以使用 Azure NetApp Files 數據保護功能,例如 Azure NetApp Files 備份 和 跨區域復寫。
VM 層級備份。 針對此方法使用 Azure 備份。
警告
請確定備份環境中的 VM 正在執行可支援性的 OS。 了解支援的OS。
當您串流大型資料庫的備份時,複製數據所需的時間,然後還原可能會超過 RTO 需求。 記憶體層級快照集是該案例的最佳選項。
建議
請仔細考慮實作以串流、記憶體層級快照集或兩種策略為基礎的備份策略。
評估備份策略對 RTO 和 RPO 需求的影響。
根據每個選項記載的輸送量限制,分析 RMAN 備份的可用記憶體目的地。 選擇符合您需求的選項。
請考慮針對您的儲存體層級快照集使用 Azure 備份,並考慮將快照集放在配對的區域或可用性區域,以取得額外的保護。
請考慮各種記憶體選項,以儲存您需要復原資料庫的封存記錄備份。 請考慮每個選項的效能、復寫和成本考慮。
制定並定期測試您的備份和還原計劃,以防止您的生產環境中出現意外的情況。
服務保護和商務持續性
本節說明如何藉由實作服務保護和商務持續性 (BC) 考慮,改善 Azure IaaS 上 Oracle 工作負載的整體高可用性 (HA) 和災害復原 (DR)。
納入下列建議來改善架構備援,最後將服務可用的時間量最大化。 旨在將計劃性中斷所造成的服務停機時間降至最低,例如修補程式、更新和升級,以及非計劃性中斷,例如失敗。 使用 Azure 和 Oracle 功能來改善從全地理位置失敗的復原。
Azure 提供許多選項,讓 Oracle on IaaS 架構中的個別元件具有高可用性。 例如,您可以:
- 使用彈性虛擬機擴展集部署 VM,以自動將 VM 分散到容錯網域。
- 建立可用性區域以防止數據中心失敗。
- 在不同的區域中放置部署,以防止完整區域失敗。
各種 Azure 記憶體功能提供不同的記憶體備援層級,例如本地備援記憶體、區域備援記憶體和異地備援記憶體。 在 Azure IaaS 上規劃 Oracle 工作負載部署時,請考慮每個選項。
您也可以使用 Oracle Data Guard,這是 Oracle 資料庫服務保護設定的工具。 Data Guard 會向前轉送,並將事務歷史記錄套用至一或多個待命資料庫。 如果您已規劃維護或失敗案例,此程式會維護主資料庫的確切複本,而您可以故障轉移至此複本。
Data Guard 有三種數據復寫模式:最大保護、最大可用性和最大效能。 每個復寫模式都會為輔助資料庫上的應用程式提供不同的記錄傳輸模式和不同的交易保證組合。
視您的策略而定,例如零延遲或零數據遺失策略,您可以選擇同步或異步設定。 您也可以根據停機時間需求上限來實作快速啟動故障轉移。 參考架構可在不到一分鐘或不到五分鐘內提供復原,最多四小時。 Oracle 資料庫的 Enterprise Edition 包含 Data Guard。
Oracle GoldenGate 是另一個工具,可用來在兩個資料庫之間復寫數據,並啟用多主要案例。 您必須個別購買 GoldenGate。
建議
請考慮 Azure 為 Oracle on Azure IaaS 實作中各種基礎結構元件提供高可用性的功能。
當您使用適用於 HA 和 DR 的 Data Guard 時,請仔細選取符合您需求的資料庫保護模式。 例如,最大效能模式會將對來源的影響降到最低,但數據遺失的可能性最高。 如需詳細資訊,請參閱 Azure 上的 Oracle BCDR 虛擬機器 登陸區域加速器和 Oracle Data Guard 保護模式。
請考慮將您的容錯移轉流程自動化。 例如,您可以使用快速啟動故障轉移。
為您的故障轉移程式建立測試程式,並定期進行測試,以避免任何問題。
使用 Azure 原生功能,例如可用性區域和 Oracle 原生工具,例如 Data Guard,以全面架構您的解決方案,以符合 HA 和 DR 需求。 下列兩個範例使用 Azure 原生和 Oracle 原生元件。
建立具有被動待命的故障轉移
本節說明具有被動待命的兩個可用性區域部署中商務關鍵 Oracle 應用程式的故障轉移案例範例。
商務關鍵 Oracle 應用程式,例如 Oracle E-Business Suite,需要預防失敗,因此需要整體架構。
此範例:
具有兩個可用性區域部署。 應用層會使用 Azure Site Recovery 搭配被動次要 VM。
利用 Data Guard 快速啟動故障轉移功能。 若要取得最高的可用性,建議您安裝兩個觀察者。 主要觀察者位於可用性區域一,次要觀察者位於可用性區域 2。 觀察者會監視和引導流量。 當主資料庫無法使用時,觀察者會自動故障轉移至輔助資料庫。 Data Guard 會執行重做同步處理。重做同步的時間範圍取決於您的重做組態。
Data Guard 已設定為 資料保護模式,例如最大可用性、最大效能或最大保護。 如需選擇工作負載需求模式的詳細資訊,請參閱 Oracle Data Guard 保護模式。
下列架構的目標是停機時間閾值少於五分鐘。
使用作用中待命建立故障轉移
本節說明在具有作用中待命的兩個可用性區域部署中,商務關鍵 Oracle 應用程式的故障轉移案例範例。
在此範例中:
Web 伺服器層、應用層和資料庫層位於自己的虛擬網路子網中。
主資料庫位於可用性區域一。
使用 Active Data Guard 將主資料庫複寫至作用中待命的資料庫位於可用性區域三。
注意
此設定需要 Active Data Guard 授權。
下列架構的目標是停機時間閾值少於一分鐘。 此故障轉移案例具有作用中待命組態,但具有只讀功能。