摘要

已完成

無論組織的系統是位於內部部署、雲端或兩者的組合,災害規劃與復原皆是 IT 作業中的重要元素。 公用雲端平台提供重要資料備份、遺失時還原、在主要系統停止運作時容錯移轉至次要系統,以及在大體上減輕 (並從中復原) 失敗的影響等服務。 以下是本課程模組中所涵蓋的一些重要概念:

  • IT 系統應該盡可能地具備容錯能力。 「容錯」(FT) 系統可在發生錯誤時,依預期表現或符合服務等級協定 (SLA) 期望。

  • 實現容錯的其中一種方式是採用被動式方法,例如工作複寫和還原點。

  • 主動式方法 (例如資源複寫和負載平衡) 也能夠達成容錯。

  • 主要雲端平台具有備份服務,可提供安全的網路以避免資料遺失。 Azure 備份與 AWS 備份皆是雲端式備份服務的其中一種範例。

  • 災害復原會在必要時將流量重新導向至次要系統,以維持商務持續性。 Amazon 和 Microsoft 等雲端服務提供者以如 AWS CloudEndure 和 Azure Site Recovery 等服務形式提供災害復原即服務 (DRaaS)。

  • 驅動災害復原計劃的一般服務等級目標,分別為復原點目標 (RPO)、復原時間目標 (RTO),以及保留時間。

  • 「持續性」是最佳做法的成功應用,可在發生災害時達到正面結果。 持續性的關鍵因素是「復原」

  • 您可以使用容錯、中斷容錯和生存能力等計量來量化復原能力。 ResiliNets 模型提供了一種編寫復原的方式。

  • 商務持續性策略的國際標準是 ISO 22301。 Azure 會使用 Azure Resiliency Framework 來達到 ISO 22301 合規性。

若要讓資訊系統具有復原能力,管理人必須致力於達成理想:資訊系統會透過不斷的改善並監視實際存在的事物,像生物一般地進化,而非機械式的進步。 自動化程序雖然能夠提供正面的用途,但仍無法取代自身努力向上。