장애 조치(failover) 클러스터 유지 관리 절차

아티클
11/23/2024

적용 대상: Azure Stack HCI, 버전 22H2 및 21H2, Windows Server 2022, Windows Server 2019, Windows Server 2016

Important

Azure Stack HCI는 이제 Azure Local의 일부입니다. 제품 설명서 이름 바꾸기가 진행 중입니다. 그러나 이전 버전의 Azure Stack HCI(예: 22H2)는 Azure Stack HCI를 계속 참조하며 이름 변경 내용이 반영되지 않습니다. 자세히 알아보기.

이 문서에서는 유지 관리를 수행하거나 다른 이유로 다시 시작하려면 물리적 서버의 전원을 닫아야 한다고 가정합니다. 서버를 오프라인으로 전환하지 않고 Azure Stack HCI 클러스터에 업데이트를 설치하려면 Azure Stack HCI 클러스터 업데이트를 참조 하세요.

유지 관리를 위해 서버를 오프라인으로 전환하려면 장애 조치(failover) 클러스터의 모든 서버에서 공유되는 스토리지의 일부를 오프라인으로 가져와야 합니다. 이렇게 하려면 오프라인으로 전환하려는 서버를 일시 중지하고, 서버의 디스크를 유지 관리 모드로 전환하고, 클러스터의 다른 서버로 클러스터된 역할 및 VM(가상 머신)을 이동하고, 클러스터의 다른 서버에서 모든 데이터를 사용할 수 있는지 확인해야 합니다. 이 프로세스를 통해 유지 관리 기간 동안 데이터를 안전하고 액세스할 수 있습니다.

Windows Admin Center 또는 PowerShell을 사용하여 유지 관리를 위해 서버를 오프라인으로 전환할 수 있습니다. 이 항목에서는 두 가지 방법을 모두 설명합니다.

Windows Admin Center를 사용하여 서버를 오프라인으로 전환

서버를 오프라인으로 전환하기 위해 준비하는 가장 간단한 방법은 Windows Admin Center를 사용하는 것입니다.

서버를 오프라인으로 전환해도 안전한지 확인

Windows Admin Center를 사용하여 오프라인으로 전환하려는 서버에 연결합니다. 도구 메뉴에서 스토리지 > 디스크를 선택하고 모든 가상 디스크의 상태 열에 온라인이 표시되는지 확인합니다.
그런 다음 스토리지 볼륨을 선택하고 모든 볼륨의 상태 열에 정상이 표시되고 모든 볼륨의 상태 열이 정상으로 표시되는지 확인합니다.>

서버 일시 중지 및 드레이닝

서버를 종료하거나 다시 시작하기 전에 서버를 일시 중지하고 서버에서 실행되는 VM과 같은 클러스터된 역할을 드레이닝(이동)해야 합니다. 유지 관리를 위해 클러스터된 서버를 오프라인으로 전환하기 전에 항상 일시 중지하고 드레이닝합니다.

Windows Admin Center를 사용하여 클러스터에 연결한 다음 클러스터 관리자의 도구 메뉴에서 컴퓨팅 > 서버를 선택합니다.
인벤토리를 선택합니다. 일시 중지하고 드레이닝하려는 서버의 이름을 클릭하고 일시 중지를 선택합니다. 다음 프롬프트가 표시됩니다.

유지 관리를 위해 서버 일시 중지: 서버를 일시 중지하시겠습니까? 이렇게 하면 가상 머신과 같은 워크로드가 클러스터의 다른 서버로 이동합니다.
예를 선택하여 서버를 일시 중지하고 드레이닝 프로세스를 시작합니다. 서버 상태는 In maintenance, Draining으로 표시되며 Hyper-V 및 VM과 같은 역할은 클러스터의 다른 서버로 즉시 실시간 마이그레이션을 시작합니다. 몇 분 정도 걸릴 수 있습니다. 다시 시작될 때까지 서버에 역할을 추가할 수 없습니다. 드레이닝 프로세스가 완료되면 서버 상태가 유지 관리에서 드레이닝 완료됨으로 표시됩니다. 운영 체제는 자동 안전 검사를 수행하여 계속 진행할 수 있는지 확인합니다. 비정상 볼륨이 있는 경우 중지되고 계속 진행해도 안전하지 않다는 경고가 표시됩니다.

서버 종료

서버가 드레이닝이 완료되면 유지 관리를 위해 안전하게 종료하거나 다시 부팅할 수 있습니다.

Warning

서버가 Azure Stack HCI, 버전 20H2, Windows Server 2019 또는 Windows Server 2016을 실행하는 경우 서버를 종료하기 전에 디스크를 유지 관리 모드로 전환한 후 클러스터로 서버를 다시 시작하기 전에 디스크를 유지 관리 모드에서 꺼내야 합니다.

서버 다시 시작

서버가 클러스터된 역할 및 VM 호스팅을 다시 시작할 준비가 되면 서버를 켜고 부팅될 때까지 기다렸다가 다음 단계를 사용하여 서버를 다시 시작합니다.

클러스터 관리자의 왼쪽 도구 메뉴에서 컴퓨팅 > 서버를 선택합니다.
인벤토리를 선택합니다. 다시 시작하려는 서버의 이름을 클릭한 다음 다시 시작을 클릭합니다.

클러스터된 역할 및 VM은 즉시 서버로 다시 실시간 마이그레이션을 시작합니다. 몇 분 정도 걸릴 수 있습니다.

스토리지가 다시 동기화되기를 기다립니다.

서버를 다시 시작하면 사용할 수 없는 동안 발생한 모든 새 쓰기를 다시 동기화해야 합니다. 지능형 변경 내용 추적을 사용하여 자동으로 발생합니다. 모든 데이터를 스캔하거나 동기화할 필요는 없으며 변경 내용만 필요합니다. 이 프로세스는 프로덕션 워크로드에 미치는 영향을 완화하기 위해 제한됩니다. 서버가 일시 중지된 시간과 새 데이터가 기록된 양에 따라 완료하는 데 몇 분 정도 걸릴 수 있습니다.

Important

클러스터의 다른 서버를 오프라인으로 전환하기 전에 다시 동기화가 완료되기를 기다려야 합니다.

스토리지 다시 동기화가 완료되었는지 확인하려면 다음을 수행합니다.

Windows Admin Center를 사용하여 클러스터에 연결하고 스토리지 > 볼륨을 선택합니다.
인벤토리를 선택합니다.
모든 볼륨에 대한 상태 열을 확인합니다. 확인이 표시되면 스토리지 다시 동기화가 완료됩니다. 이제 클러스터의 다른 서버를 오프라인으로 전환해도 안전합니다.

PowerShell을 사용하여 서버를 오프라인으로 전환

PowerShell을 사용하여 장애 조치(failover) 클러스터에서 서버를 제대로 일시 중지, 드레이닝 및 다시 시작하려면 다음 절차를 따르세요.

서버를 오프라인으로 전환해도 안전한지 확인

모든 볼륨이 정상인지 확인하려면 관리자 권한으로 다음 cmdlet을 실행합니다.

Get-VirtualDisk

다음은 출력의 모양에 대한 예입니다.

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

모든 볼륨의 HealthStatus 속성이 정상이고 OperationalStatus에 OK가 표시되는지 확인합니다.

장애 조치(failover) 클러스터 관리자를 사용하여 이 작업을 수행하려면 스토리지>디스크로 이동합니다.

서버 일시 중지 및 드레이닝

관리자 권한으로 다음 cmdlet을 실행하여 서버를 일시 중지하고 드레이닝합니다.

Suspend-ClusterNode -Drain

장애 조치(failover) 클러스터 관리자에서 이 작업을 수행하려면 노드로 이동하여 노드를 마우스 오른쪽 단추로 클릭한 다음 드레이닝 역할 일시 중지>를 선택합니다.

서버가 Azure Stack HCI, 버전 21H2 또는 Windows Server 2022를 실행하는 경우 서버를 일시 중지하고 드레이닝하면 서버의 디스크도 유지 관리 모드로 전환됩니다. 서버에서 Azure Stack HCI, 버전 20H2, Windows Server 2019 또는 Windows Server 2016을 실행하는 경우 이 작업을 수동으로 수행해야 합니다(다음 단계 참조).

유지 관리 모드로 디스크 배치

Azure Stack HCI 버전 20H2, Windows Server 2019 및 Windows Server 2016에서는 서버 디스크를 유지 관리 모드로 전환하면 저장소 공간 Direct에서 데이터를 정상적으로 플러시하고 커밋하여 서버 종료가 애플리케이션 상태에 영향을 주지 않도록 할 수 있습니다. 디스크가 유지 관리 모드로 전환되는 즉시 더 이상 쓰기를 허용하지 않습니다. 스토리지 다시 동기화 시간을 최소화하려면 다시 부팅하기 직전에 디스크를 유지 관리 모드로 전환하고 시스템이 백업되는 즉시 유지 관리 모드에서 제외하는 것이 좋습니다.

참고 항목

서버에서 Azure Stack HCI, 버전 21H2 또는 Windows Server 2022를 실행하는 경우 서버가 일시 중지되고 드레이닝될 때 디스크가 자동으로 유지 관리 모드로 전환되므로 이 단계를 건너뛸 수 있습니다. 이러한 운영 체제에는 시스템 및 네트워크 리소스에 대한 재동기를 더 빠르고 덜 영향을 주는 세분화된 복구 기능이 있어 서버 및 스토리지 유지 관리를 함께 수행할 수 있습니다.

서버에서 Windows Server 2019 또는 Azure Stack HCI 버전 20H2를 실행하는 경우 관리자 권한으로 다음 cmdlet을 실행합니다.

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

서버에서 Windows Server 2016을 실행하는 경우 대신 다음 구문을 사용합니다.

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

서버 종료

서버가 드레이닝이 완료되면 PowerShell 및 장애 조치(failover) 클러스터 관리자에서 일시 중지됨으로 표시됩니다.

이제 서버 또는 PowerShell cmdlet을 사용 Stop-Computer 하거나 장애 조치(failover) 클러스터 관리자를 사용하여 서버를 안전하게 종료하거나 Restart-Computer 다시 시작할 수 있습니다.

참고 항목

클러스터 서비스를 종료하거나 시작/중지하는 서버에서 명령을 실행하는 Get-VirtualDisk 경우 서버의 작동 상태가 불완전하거나 저하된 것으로 보고될 수 있으며 상태 열에 경고가 나열될 수 있습니다. 이것은 정상이며 우려를 일으키지 않아야합니다. 모든 볼륨은 온라인 상태로 유지되며 액세스할 수 있습니다.

디스크를 유지 관리 모드에서 제외

서버가 Azure Stack HCI, 버전 20H2, Windows Server 2019 또는 Windows Server 2016을 실행하는 경우 클러스터로 서버를 다시 시작하기 전에 디스크에서 스토리지 유지 관리 모드를 사용하지 않도록 설정해야 합니다. 스토리지 다시 동기화 시간을 최소화하려면 시스템이 백업되는 즉시 유지 관리 모드에서 제외하는 것이 좋습니다.

참고 항목

서버에서 Azure Stack HCI, 버전 21H2 또는 Windows Server 2022를 실행하는 경우 서버가 다시 시작될 때 디스크가 유지 관리 모드에서 자동으로 제거되므로 이 단계를 건너뛸 수 있습니다.

서버가 Windows Server 2019 또는 Azure Stack HCI 버전 20H2를 실행하는 경우 관리자 권한으로 다음 cmdlet을 실행하여 스토리지 유지 관리 모드를 사용하지 않도록 설정합니다.

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

서버에서 Windows Server 2016을 실행하는 경우 대신 다음 구문을 사용합니다.

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

서버 다시 시작

서버를 클러스터로 다시 시작합니다. 이전에 서버에서 실행되었던 클러스터된 역할 및 VM을 반환하려면 선택적 -Failback 플래그를 사용합니다.

Resume-ClusterNode –Failback Immediate

장애 조치(failover) 클러스터 관리자에서 이 작업을 수행하려면 노드로 이동하여 노드를 마우스 오른쪽 단추로 클릭한 다음 장애 조치(Fail Roles) 다시 시작을 선택합니다>.

서버가 다시 시작되면 PowerShell 및 장애 조치(failover) 클러스터 관리자에서 위로 표시됩니다.

스토리지가 다시 동기화되기를 기다립니다.

서버가 다시 시작되면 클러스터의 다른 서버를 오프라인으로 전환하기 전에 다시 동기화가 완료되기를 기다려야 합니다.

관리자 권한으로 다음 cmdlet을 실행하여 진행률을 모니터링합니다.

Get-StorageJob

다시 동기화가 이미 완료된 경우 출력이 표시되지 않습니다.

다음은 여전히 실행 중인 resync(복구) 작업을 보여 주는 몇 가지 예제 출력입니다.

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

BytesTotal 열은 다시 동기화해야 하는 스토리지의 양을 보여 줍니다. PercentComplete 열에 진행률이 표시됩니다.

Warning

이러한 복구 작업이 완료될 때까지 다른 서버를 오프라인으로 전환해도 안전하지 않습니다.

이 시간 동안 HealthStatus에서 볼륨은 정상인 경고로 계속 표시됩니다.

예를 들어 스토리지가 Get-VirtualDisk 다시 동기화되는 동안 cmdlet을 사용하는 경우 다음 출력이 표시될 수 있습니다.

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

작업이 완료되면 cmdlet을 사용하여 Get-VirtualDisk 볼륨이 다시 정상으로 표시되는지 확인합니다. 다음은 몇 가지 출력 예입니다.

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

이제 클러스터의 다른 서버를 일시 중지하고 다시 시작하는 것이 안전합니다.

다음 단계

관련 정보는 다음을 참조하세요.

다음을 통해 공유

장애 조치(failover) 클러스터 유지 관리 절차

Windows Admin Center를 사용하여 서버를 오프라인으로 전환

서버를 오프라인으로 전환해도 안전한지 확인

서버 일시 중지 및 드레이닝

서버 종료

서버 다시 시작

스토리지가 다시 동기화되기를 기다립니다.

PowerShell을 사용하여 서버를 오프라인으로 전환

서버를 오프라인으로 전환해도 안전한지 확인

서버 일시 중지 및 드레이닝

유지 관리 모드로 디스크 배치

서버 종료

디스크를 유지 관리 모드에서 제외

서버 다시 시작

스토리지가 다시 동기화되기를 기다립니다.

다음 단계

피드백

추가 리소스