Azure Stack Edge Pro GPU 디바이스에서 GPU 공유

아티클
03/13/2024

GPU(그래픽 처리 장치)는 그래픽 렌더링을 가속화하기 위해 설계된 특수 프로세서입니다. GPU는 많은 데이터 조각을 동시에 처리할 수 있으므로 기계 학습, 동영상 편집 및 게임 애플리케이션에 유용합니다. 범용 컴퓨팅을 위한 CPU 외에도 Azure Stack Edge Pro GPU 디바이스에는 하드웨어 가속 추론과 같은 컴퓨팅 집약적 워크로드를 위해 하나 또는 두 개의 Nvidia Tesla T4 GPU가 포함될 수 있습니다. 자세한 내용은 Nvidia의 Tesla T4 GPU를 참조하세요.

많은 기계 학습 또는 기타 컴퓨팅 워크로드에는 전용 GPU가 필요하지 않을 수 있습니다. GPU를 공유할 수 있으며 컨테이너화된 워크로드 또는 VM 워크로드 간에 GPU를 공유하면 GPU의 성능 이점에 큰 영향을 주지 않고 GPU 활용도를 높일 수 있습니다.

VM에서 GPU 사용

Azure Stack Edge Pro 디바이스에서 VM 워크로드를 배포할 때 GPU를 공유할 수 없습니다. GPU는 하나의 VM에만 매핑될 수 있습니다. 즉, GPU가 한 개인 디바이스에는 GPU VM이 하나만 있고 GPU가 두 개인 디바이스에는 VM이 두 개만 있을 수 있습니다. 컨테이너화된 워크로드용으로 구성된 Kubernetes가 있는 디바이스에서 GPU VM을 사용할 때 고려해야 할 다른 요소도 있습니다. 자세한 내용은 GPU VM 및 Kubernetes를 참조하세요.

컨테이너에서 GPU 사용

컨테이너화된 워크로드를 배포하는 경우 하드웨어 및 소프트웨어 계층에서 여러 가지 방법으로 GPU를 공유할 수 있습니다. Azure Stack Edge Pro 디바이스에서 Tesla T4 GPU를 사용하면 소프트웨어 공유로 제한됩니다. 디바이스에서 다음 두 가지 접근 방식을 사용하여 GPU의 소프트웨어를 공유할 수 있습니다.

첫 번째 접근 방식은 환경 변수를 사용하여 시간을 공유할 수 있는 GPU 수를 지정하는 것입니다. 이 접근 방식을 사용할 때 다음 사항에 주의하세요.
- 이 방법을 사용하여 GPU를 하나 또는 둘 다 지정할 수 있습니다. 소수 자릿수 사용은 지정할 수 없습니다.
- 여러 모듈을 하나의 GPU에 매핑할 수 있지만 같은 모듈을 둘 이상의 GPU에 매핑할 수 없습니다.
- Nvidia SMI 출력을 통해 메모리 사용률을 포함한 전체 GPU 사용률을 볼 수 있습니다.
자세한 내용은 디바이스에서 GPU를 사용하는 IoT Edge 모듈을 배포하는 방법을 참조하세요.
두 번째 접근 방식에서는 Nvidia GPU에서 다중 프로세스 서비스를 사용하도록 설정해야 합니다. MPS는 CUDA를 사용하는 여러 프로세스를 단일 공유 GPU에서 동시에 실행할 수 있는 런타임 서비스입니다. MPS는 최대 사용률을 얻기 위해 GPU의 여러 다른 프로세스에서 커널 및 메모리 작업을 겹칠 수 있습니다. 자세한 내용은 다중 프로세스 서비스를 참조하세요.

이 접근 방식을 사용할 때 다음 사항에 주의하세요.
- MPS를 사용하면 GPU 배포에서 더 많은 플래그를 지정할 수 있습니다.
- MPS를 통해 부분 사용량을 지정하여 디바이스에 배포된 각 애플리케이션의 사용량을 제한할 수 있습니다. 다음 매개 변수를 추가하여 deployment.yaml의 env 섹션에서 각 앱에 사용할 GPU 백분율을 지정할 수 있습니다.
```
// Example: application wants to limit gpu percentage to 20%

    env:
        - name: CUDA_MPS_ACTIVE_THREAD_PERCENTAGE
            value: "20"
```

GPU 사용률

디바이스에 배포된 컨테이너화된 워크로드에서 GPU를 공유할 때 Nvidia 시스템 관리 인터페이스(nvidia-smi)를 사용할 수 있습니다. Nvidia-smi는 Nvidia GPU 디바이스를 관리하고 모니터링하는 데 도움이 되는 명령줄 유틸리티입니다. 자세한 내용은 Nvidia 시스템 관리 인터페이스를 참조하세요.

GPU 사용량을 보려면 먼저 디바이스의 PowerShell 인터페이스에 연결합니다. Get-HcsNvidiaSmi 명령을 실행하고 Nvidia SMI 출력을 봅니다. MPS를 사용으로 설정한 다음 디바이스에 여러 워크로드를 배포하여 GPU 사용률이 변경되는 방식도 볼 수 있습니다. 자세한 내용은 다중 프로세스 서비스 사용을 참조하세요.

다음을 통해 공유

VM에서 GPU 사용

컨테이너에서 GPU 사용

GPU 사용률

다음 단계

피드백

추가 리소스

다음을 통해 공유

Azure Stack Edge Pro GPU 디바이스에서 GPU 공유

GPU 공유 정보

VM에서 GPU 사용

컨테이너에서 GPU 사용

GPU 사용률

다음 단계

피드백

추가 리소스