摘要

無論組織的系統是位於內部部署、雲端或兩者的組合，災害規劃與復原皆是 IT 作業中的重要元素。公用雲端平台提供重要資料備份、遺失時還原、在主要系統停止運作時容錯移轉至次要系統，以及在大體上減輕 (並從中復原) 失敗的影響等服務。以下是本課程模組中所涵蓋的一些重要概念：

IT 系統應該盡可能地具備容錯能力。「容錯」(FT) 系統可在發生錯誤時，依預期表現或符合服務等級協定 (SLA) 期望。
實現容錯的其中一種方式是採用被動式方法，例如工作複寫和還原點。
主動式方法 (例如資源複寫和負載平衡) 也能夠達成容錯。
主要雲端平台具有備份服務，可提供安全的網路以避免資料遺失。 Azure 備份與 AWS 備份皆是雲端式備份服務的其中一種範例。
災害復原會在必要時將流量重新導向至次要系統，以維持商務持續性。 Amazon 和 Microsoft 等雲端服務提供者以如 AWS CloudEndure 和 Azure Site Recovery 等服務形式提供災害復原即服務 (DRaaS)。
驅動災害復原計劃的一般服務等級目標，分別為復原點目標 (RPO)、復原時間目標 (RTO)，以及保留時間。
「持續性」是最佳做法的成功應用，可在發生災害時達到正面結果。持續性的關鍵因素是「復原」。
您可以使用容錯、中斷容錯和生存能力等計量來量化復原能力。 ResiliNets 模型提供了一種編寫復原的方式。
商務持續性策略的國際標準是 ISO 22301。 Azure 會使用 Azure Resiliency Framework 來達到 ISO 22301 合規性。

若要讓資訊系統具有復原能力，管理人必須致力於達成理想：資訊系統會透過不斷的改善並監視實際存在的事物，像生物一般地進化，而非機械式的進步。自動化程序雖然能夠提供正面的用途，但仍無法取代自身努力向上。

意見反應