共用方式為


使用 Azure ExpressRoute 設計高可用性

Azure ExpressRoute 專為高可用性而設計,可提供Microsoft資源的電信業級專用網連線。 這表示Microsoft網路中沒有單一失敗點。 為了將可用性最大化,您 Azure ExpressRoute 線路的客戶和服務提供者區段也應該針對高可用性進行架構。 本文涵蓋使用 Azure ExpressRoute 建置強固連線的網路架構考慮,以及微調功能,以改善 Azure ExpressRoute 線路的高可用性。

注意

本文所述的概念同樣適用於在虛擬 WAN 下建立 Azure ExpressRoute 線路,或是在虛擬 WAN 底下建立的。

架構考量

下圖說明使用 Azure ExpressRoute 線路連線以最大化可用性的建議方式。

1

為了達到高可用性,必須在整個端對端網路中維護備援。 這表示維護內部部署網路內的備援,而不會危害服務提供者網路內的備援。 這至少涉及避免單一網路失敗點。 網路裝置的備援電源和冷卻功能可進一步提升高可用性。

初步的實體層設計考量

如果您在相同的 Customer Premises Equipment (CPE) 上終止 Azure ExpressRoute 線路的主要和次要連線,您會危害內部部署網路內的高可用性。 此外,使用 CPE 的相同埠來設定這兩個連線,會強制合作夥伴在其網路區段上危害高可用性。 這可能會藉由終止不同子介面下的兩個連線,或合併夥伴網路內的兩個連線,如下所示。

2

終止不同地理位置中 Azure ExpressRoute 線路的主要和次要連線可能會危害網路效能。 如果在不同位置終止的連線之間主動負載平衡流量,則兩個路徑之間的網路等待時間差異可能會產生次佳的效能。

如需異地備援設計考慮,請參閱 使用 Azure ExpressRoute 設計災害復原。

主動-主動連線

Microsoft 網路會以主動-主動模式運作 Azure ExpressRoute 線路的主要和次要連線。 不過,您可以強制備援連線透過路由公告以主動-被動模式運作。 在前面公告更特定的路由和 BGP AS 路徑是慣用一個路徑而不是另一個路徑的常見技術。

若要改善高可用性,建議您在主動-主動模式中操作這兩個連線。 這可讓Microsoft網路在每個流程之間平衡流量的負載。

在主動-被動模式中執行連線時,如果主動路徑失敗,這兩個聯機都會失敗。 失敗的常見原因包括沒有主動管理被動連線和被動連線公告過時路由。

或者,在主動-主動模式中執行連線只會造成大約一半的流程失敗並重新路由,大幅改善平均復原時間(MTTR)。

注意

在影響一個連線的維護或非計劃性事件期間,Microsoft會使用 AS 路徑預先排清流量至狀況良好的連線。 請確定流量可以在Microsoft設定路徑前面設定時,透過狀況良好的路徑路由傳送,並適當地設定必要的路由公告,以避免服務中斷。

Microsoft 對等互連的 NAT

Microsoft對等互連是針對公用端點之間的通訊所設計。 一般而言,在透過Microsoft對等互連進行通訊之前,內部部署私人端點是具有客戶或合作夥伴網路上公用IP的網路位址已翻譯(NATed)。 在主動-主動設定中同時使用主要和次要聯機會影響從其中一個聯機失敗中復原的速度。 以下說明兩個不同的 NAT 選項:

3

選項 1:

在分割主要和次要連線之間的流量之後,就會套用NAT。 獨立 NAT 集區用於主要和次要裝置,以符合具狀態 NAT 需求。 傳回流量抵達流程輸出所在的相同邊緣裝置。

如果 Azure ExpressRoute 連線失敗,對應的 NAT 集區會變成無法連線,而中斷所有網路流程。 這些流程必須由TCP或視窗逾時后的應用層重新建立。 在失敗期間,在還原連線之前,Azure 無法使用對應的 NAT 連線到內部部署伺服器。

選項 2:

在分割主要和次要連線之間的流量之前,會使用通用NAT集區。 這不會造成單一失敗點,因此可維持高可用性。

即使主要或次要連線失敗,NAT 集區仍可連線,讓網路層能夠重新路由封包並更快復原。

注意

  • 如果使用 NAT 選項 1(主要和次要連線的獨立 NAT 集區),並將 IP 位址的埠從一個 NAT 集區對應至內部部署伺服器,則如果對應的連線失敗,將無法透過 Azure ExpressRoute 線路連線伺服器。
  • 在具狀態裝置上終止 Azure ExpressRoute BGP 連線可能會導致Microsoft或 Azure ExpressRoute 提供者在計劃性或非計劃性維護期間發生故障轉移問題。 測試您的設定,以確保適當的故障轉移,並盡可能終止無狀態裝置上的 BGP 工作階段。

私人對等互連的微調功能

本節會檢閱選擇性功能,根據 Azure 部署和 MTTR 的敏感度,協助改善 Azure ExpressRoute 線路的高可用性。 具體而言,它涵蓋 Azure ExpressRoute 虛擬網路閘道的區域感知部署和雙向轉送偵測 (BFD)。

可用性區域感知 Azure ExpressRoute 虛擬網路閘道

Azure 區域中的可用性區域結合了容錯網域和更新網域。 若要達到最高的復原能力和可用性,請設定區域備援 Azure ExpressRoute 虛擬網路網關。 如需詳細資訊,請參閱關於 Azure 可用性區域 中的區域備援虛擬網路閘道。 若要設定區域備援虛擬網路閘道,請參閱在 Azure 可用性區域中建立區域備援虛擬網路閘道

改善失敗偵測時間

Azure ExpressRoute 支援透過私人對等互連的 BFD,從大約 3 分鐘(預設)到不到一秒,在內部部署端上減少 Microsoft Enterprise Edge (MSE) 與其 BGP 鄰居之間的第 2 層網路失敗偵測時間。 快速失敗偵測有助於加速復原。 如需詳細資訊,請參閱 透過 Azure ExpressRoute 設定 BFD。

下一步

本文討論如何設計 Azure ExpressRoute 線路的高可用性。 Azure ExpressRoute 線路對等互連點會釘選到地理位置,而且可能會受到影響整個位置的災難性失敗影響。

如需針對可承受整個區域重大失敗之Microsoft骨幹建置異地備援網路連線的設計考慮,請參閱 使用 Azure ExpressRoute 私人對等互連設計災害復原。