Windows Server에서 GPU 가속 계획
이 문서에서는 Windows Server에서 사용할 수 있는 그래픽 가상화 기능을 소개합니다.
GPU 가속을 사용하는 경우
워크로드에 따라 GPU 가속을 고려할 수 있습니다. GPU 가속을 선택하기 전에 고려해야 할 사항은 다음과 같습니다.
- 앱 및 데스크톱 원격(VDI/DaaS) 워크로드: Windows Server를 사용하여 앱 또는 데스크톱 원격 서비스를 빌드하는 경우 사용자가 실행할 것으로 예상되는 앱 카탈로그를 고려합니다. CAD/CAM 앱, 시뮬레이션 앱, 게임 및 렌더링/시각화 앱과 같은 일부 유형의 앱은 3D 렌더링에 크게 의존하여 원활하고 반응형 대화형 작업을 제공합니다. 대부분의 고객은 이러한 종류의 앱에서 합리적인 사용자 환경을 위해 GPU가 필요하다고 간주합니다.
- 원격 렌더링, 인코딩 및 시각화 워크로드: 이러한 그래픽 기반 워크로드는 비용 효율성 및 처리량 목표를 달성하기 위해 효율적인 3D 렌더링 및 프레임 인코딩/디코딩과 같은 GPU의 특수 기능에 크게 의존하는 경향이 있습니다. 이러한 종류의 워크로드의 경우 단일 GPU 지원 VM(Virtual Machine)이 많은 CPU 전용 VM의 처리량과 일치할 수 있습니다.
- HPC 및 ML 워크로드: 고성능 컴퓨팅 및 기계 학습 모델 학습 또는 유추와 같은 데이터 병렬 계산 워크로드의 경우 GPU는 결과 시간, 유추 시간 및 학습 시간을 크게 단축할 수 있습니다. 또는 비슷한 성능 수준에서 CPU 전용 아키텍처보다 더 나은 비용 효율성을 제공할 수 있습니다. 많은 HPC(High Performance Compute) 및 기계 학습 프레임워크는 GPU 가속을 사용할 수 있습니다. GPU 가속이 특정 워크로드에 도움이 될 수 있는지 여부를 고려합니다.
Windows Server의 GPU 가상화 보호
GPU 가상화 기술을 사용하면 일반적으로 가상 머신 내에서 가상화된 환경에서 GPU 가속을 수행할 수 있습니다. 워크로드가 Hyper-V를 사용하여 가상화되는 경우 물리적 GPU에서 가상화된 앱 또는 서비스로 GPU 가속을 제공하기 위해 그래픽 가상화를 사용해야 합니다. 그러나 워크로드가 실제 Windows Server 호스트에서 직접 실행되는 경우 그래픽 가상화가 필요하지 않습니다. 앱과 서비스는 이미 Windows Server에서 기본적으로 지원되는 GPU 기능 및 API에 액세스할 수 있습니다.
다음 그래픽 가상화 기술은 Windows Server의 Hyper-V VM에서 사용할 수 있습니다.
Windows Server는 VM 워크로드 외에도 Windows 컨테이너 내에서 컨테이너화된 워크로드의 GPU 가속을 지원합니다. 자세한 내용은 Windows 컨테이너에서 GPU 가속화를 참조하세요.
DDA(Discrete Device Assignment)
DDA(Discrete Device Assignment)를 사용하면 하나 이상의 물리적 GPU를 가상 머신에 헌정할 수 있습니다. DDA 배포에서 가상화된 워크로드는 네이티브 드라이버에서 실행되며 일반적으로 GPU의 기능에 대한 모든 권한을 갖습니다. DDA는 최고 수준의 앱 호환성 및 잠재적 성능을 제공합니다. DDA는 지원 대상인 Linux VM에 GPU 가속을 제공할 수도 있습니다.
각 물리적 GPU는 최대 하나의 VM에 가속을 제공할 수 있으므로 DDA 배포는 제한된 수의 가상 머신만 가속화할 수 있습니다. 아키텍처에서 공유 가상 머신을 지원하는 서비스를 개발하는 경우 VM당 여러 가속 워크로드를 호스팅하는 것이 좋습니다. 예를 들어 원격 데스크톱 서비스 솔루션을 빌드하는 경우 Windows Server의 다중 세션 기능을 사용하여 각 VM에서 여러 사용자 데스크톱을 호스트하여 사용자 규모를 향상시킬 수 있습니다. 이러한 사용자는 GPU 가속의 이점을 공유합니다.
자세한 내용은 다음 문서를 참조하십시오.
GPU-P(GPU Partitioning)
Windows Server 2025부터 GPU 분할을 사용하면 여러 VM(Virtual Machine)과 물리적 GPU 디바이스를 공유할 수 있습니다. GPU 분할 또는 GPU 가상화를 사용하면 각 VM은 전체 GPU 대신 GPU의 전용 부분을 가져옵니다.
GPU 분할 기능은 각 VM에 대해 예측 가능한 성능으로 하드웨어 지원 보안 경계를 제공하는 SR-IOV(Single Root IO Virtualization) 인터페이스를 사용합니다. 각 VM은 전용 GPU 리소스에만 액세스할 수 있으며 보안 하드웨어 분할은 다른 VM의 무단 액세스를 방지합니다.
GPU 분할에 대한 자세한 내용은 다음 문서를 참조하세요.
DDA 및 GPU 분할 비교
다음 기능을 고려하고 배포를 계획할 때 그래픽 가상화 기술 간의 차이점을 지원합니다.
설명 | 개별 디바이스 할당 | GPU 분할 |
---|---|---|
GPU 리소스 모델 | 전용 한정 | Partitioned |
VM 밀도 | 낮음(하나 이상의 GPU에서 하나의 VM으로) | 높음(하나 이상의 GPU에서 여러 VM으로) |
앱 호환성 | 공급 기업에서 제공하는 모든 GPU 기능(DX 12, OpenGL, CUDA) | 공급 기업에서 제공하는 모든 GPU 기능(DX 12, OpenGL, CUDA) |
AVC444 | 그룹 정책을 통해 사용 가능 | 그룹 정책을 통해 사용 가능 |
GPU VRAM | GPU에서 지원하는 최대 VRAM | 파티션당 GPU에서 지원하는 최대 VRAM |
게스트의 GPU 드라이버 | GPU 공급 기업 드라이버(NVIDIA, AMD, Intel) | GPU 공급 기업 드라이버(NVIDIA, AMD, Intel) |