Azure Virtual Machines용 Azure 고가용성 및 재해 복구 기능 설명

완료됨

Azure는 IaaS 배포를 위한 가용성을 향상시키는 세 가지 기본 옵션을 제공합니다.

  • 가용성 집합

  • 가용성 영역

  • Azure Site Recovery

세 옵션 모두 VM(가상 머신) 외부에 위치하며 VM 안에서 어떤 종류의 워크로드가 실행 중인지 인식하지 못합니다.

가용성 집합

가용성 집합은 Azure 관련 유지 관리 중이거나 단일 데이터 센터에서 단일 실패 지점이 발생하는 경우에도 작동 시간을 제공합니다. 가용성 집합은 Azure 플랫폼에 도입된 첫 번째 가용성 기능 중 하나이며 VM에 대한 반 선호도로 간주할 수 있습니다. 즉, 가용성 집합 또는 로그 전달 쌍에 SQL Server VM이 2개 있는 경우 이들은 절대로 동일한 물리적 서버에서 실행되지 않습니다.

가용성 집합은 장애 도메인과 업데이트 도메인 모두에 분리되어 들어가 기본 Azure 인프라에 대한 두 도메인의 업데이트를 모두 지원합니다. 장애 도메인은 데이터 센터 내에서 동일한 전원과 네트워크를 사용하는 서버의 집합입니다. 아래 이미지에서 FD 0, 1 및 2로 표시된 것과 같이 데이터 센터에는 최대 3개의 장애 도메인이 있을 수 있습니다. 업데이트 도메인(아래 이미지에서 UD라고 표시됨)은 동시에 재부팅할 수 있는 가상 머신 그룹과 기본적인 물리적 하드웨어를 나타냅니다. 업데이트 도메인이 서로 달라 확실한 분리 작업이 가능합니다.

장애 도메인 및 업데이트 도메인

가용성 집합과 가용성 영역은 OS 또는 RDBMS 크래시와 같은 게스트 내 오류로부터 보호해 주지 않습니다. 따라서 RTO와 RPO를 충족하려면 AG 또는 FCI와 같은 추가 솔루션을 구현해야 합니다. 가용성 집합과 가용성 영역 모두 데이터 센터 오류, 물리적 하드웨어 오류, 네트워크 중단, 전력 차단과 같은 Azure 수준의 환경 문제가 미치는 영향을 최소화하도록 설계되었습니다.

다중 계층 애플리케이션의 경우 애플리케이션의 각 계층을 자체 가용성 집합에 배치해야 합니다. 예를 들어 AD DS(Active Directory Domain Services)와 함께 SQL Server 백 엔드가 있는 웹 애플리케이션을 빌드하는 경우 계층(웹, 데이터베이스 및 AD DS)별로 가용성 집합을 만들 수 있습니다.

가용성 집합으로만 IaaS VM을 분리할 수 있는 것은 아닙니다. Azure도 가용성 영역을 제공하지만 양자를 결합할 수는 없습니다. 둘 중 어느 하나만 선택할 수 있습니다.

가용성 영역

가용성 영역은 Azure에서 발생하는 데이터 센터 수준의 오류를 처리합니다. 각 Azure 지역은 서로 간에 네트워크 연결의 대기 시간이 짧은 여러 데이터 센터로 구성됩니다. 가용성 영역을 지원하는 지역에 VM 리소스를 배포하는 경우 해당 리소스를 선택에 따라 영역 1, 2 또는 3으로 배포할 수 있습니다. 영역은 Azure 지역 내의 고유한 물리적 위치, 즉 데이터 센터입니다.

영역 번호는 논리적 표현입니다. 예를 들어 2명의 Azure 구독자가 자체 구독에서 VM을 영역 1에 배포한다고 해서 해당 VM이 동일한 물리적 Azure 데이터 센터에 존재하게 되는 것은 아닙니다. 또한 거리 때문에 영역 배포에 추가 대기 시간이 발생할 수 있습니다. VM 간의 대기 시간을 테스트하여 대기 시간이 성능 목표를 충족하는지 확인해야 합니다. 대부분의 경우 왕복 대기 시간은 1밀리초 미만이며 이 정도의 대기 시간은 가용성 그룹과 마찬가지로 기능의 동기 데이터 이동을 지원합니다. Azure SQL Database를 가용성 영역에 배포할 수도 있습니다.

Azure Site Recovery

Azure Site Recovery는 Azure 수준에서 VM을 위한 향상된 가용성을 제공하며 SQL Server를 호스팅하는 VM에서 작동할 수 있습니다. Azure Site Recovery는 VM을 한 Azure 지역에서 다른 지역으로 복제하여 해당 VM을 위한 재해 복구 솔루션을 만듭니다. 앞에서 설명한 것처럼 이 기능은 SQL Server가 VM에서 실행 중인지 인식하지 못하며 트랜잭션에 대해 어떤 것도 인식하지 못합니다. Azure Site Recovery는 RTO를 충족할 수는 있지만 데이터가 SQL Server의 어느 위치에 있는지 고려하지 않으므로 RPO는 충족하지 못할 수 있습니다. Azure Site Recovery에는 월 RTO가 2시간으로 지정되어 있습니다. 대부분의 데이터베이스 전문가는 재해 복구에 데이터베이스 기반 방법을 선호하지만 Azure Site Recovery가 각자의 RTO 및 RPO 필요를 충족한다면 Azure Site Recovery가 효과적입니다.