Partizionare e assegnare GPU a una macchina virtuale
Si applica a: Locale di Azure, versioni 23H2 e 22H2
Nota
Il modo consigliato per creare e gestire macchine virtuali in Azure Locale, versione 23H2 consiste nell'usare il piano di controllo di Azure Arc. Usare il meccanismo descritto di seguito per gestire le macchine virtuali solo se sono necessarie funzionalità non disponibili nelle macchine virtuali di Azure Arc.
Questo articolo descrive come configurare le partizioni delle unità di elaborazione grafica (GPU) e come assegnare una partizione a una macchina virtuale. Fornisce istruzioni su come configurare il numero di partizioni GPU, assegnare partizioni GPU e annullare l'assegnazione di partizioni GPU tramite Windows Admin Center e PowerShell.
Per eseguire il provisioning della funzionalità di partizionamento GPU, occorre completare i passaggi seguenti:
- Completare tutti i prerequisiti.
- Verificare l'installazione del driver GPU.
- Configurare il numero di partizioni.
- Assegnare la partizione GPU a una macchina virtuale.
- Se necessario, annullare l'assegnazione di una partizione GPU da una macchina virtuale.
Prerequisiti
Prima di iniziare a usare la funzionalità di partizionamento GPU, è necessario tenere conto di diversi aspetti e requisiti:
Prerequisiti per il server host
È necessario disporre di Windows Server 2025 installato nel server host. Se il clustering è obbligatorio durante la migrazione in tempo reale di un host di macchine virtuali, è necessario installare Windows Server 2025 Datacenter.
Ruolo Hyper-V installato e configurato sul server. Vedere Installare il ruolo Hyper-V in Windows Server per scoprire come iniziare.
- Installare il sistema operativo Azure Stack HCI nei computer locali di Azure. Consulta Installare il sistema operativo Azure Stack HCI, versione 23H2.
Installare il dispositivo GPU fisico di marca, modello e dimensioni identici in ogni server del cluster. Fare riferimento alla documentazione fornita dal partner OEM per installare il dispositivo GPU nei server fisici del cluster.
Installare i driver GPU in ogni server del cluster seguendo le istruzioni fornite dai fornitori di hardware indipendenti di GPU. Per i driver GPU NVIDIA, vedere la documentazione di vGPU NVIDIA.
Assicurarsi che il supporto della virtualizzazione e SR-IOV siano abilitati nel BIOS di ogni server del cluster. Contattare il fornitore del sistema se non si è in grado di identificare l'impostazione corretta nel BIOS.
- Gli host del cluster devono disporre di processori in grado di supportare il tracciamento dei bit DMA dell'unità di gestione della memoria di input/output (IOMMU). Ad esempio, i processori che supportano Intel VT-D o AMD-Vi.
Nota
Quando si esegue la migrazione in tempo reale di una macchina virtuale con una partizione GPU assegnata, la migrazione in tempo reale di Hyper-V passerà automaticamente all'uso di TCP/IP con compressione. Questo ha il potenziale effetto di aumentare l'utilizzo della CPU di un host. Inoltre, le migrazioni in tempo reale potrebbero richiedere più tempo rispetto alle macchine virtuali senza partizioni GPU collegate.
Prerequisiti per le macchine virtuali
Distribuire una macchina virtuale usando un sistema operativo guest dall'elenco Sistemi operativi guest supportati.
Installare i driver GPU nella macchina virtuale seguendo le istruzioni dei fornitori di hardware indipendenti di GPU. Per i driver GPU NVIDIA, vedere la documentazione di vGPU NVIDIA.
Prerequisiti per Windows Admin Center
Se si usa Windows Admin Center per eseguire il provisioning del partizionamento GPU, è necessario installare la versione più recente di Windows Admin Center con l'estensione GPU, versione 2.8.0 o successive. Per istruzioni su come installare le GPUs estensioni in Windows Admin Center, vedere Installazione di un'estensione.
Dopo essere stata installata, l'estensione viene visualizzata nella scheda Estensioni installate, come illustrato nello screenshot seguente. Assicurarsi che la versione dell'estensione GPU sia 2.8.0 o versioni successive.
Prerequisiti per PowerShell
Se si usa PowerShell per eseguire il provisioning del partizionamento GPU, è necessario eseguire tutti i comandi di PowerShell come utente amministratore.
Per informazioni dettagliate su come usare i comandi di PowerShell per il partizionamento GPU, vedere la documentazione di riferimento per Add-VMGpuPartitionAdapter, Get-VMGpuPartitionAdapter e Remove-VMGpuPartitionAdapter.
Verificare l'installazione del driver GPU
Una volta completati tutti i prerequisiti, è necessario verificare se il driver GPU è installato ed è partizionabile.
Seguire questa procedura per verificare se il driver GPU è installato e partizionabile usando Windows Admin Center:
Avviare Windows Admin Center e assicurarsi che l'estensione GPU sia già installata.
Selezionare Gestione cluster dal menu a discesa in alto e connettersi al cluster.
Dal menu Impostazioni selezionare Estensioni>GPU.
La scheda GPU nella pagina GPU mostra l'inventario di tutti i server e di tutte le GPU fisiche installate su ciascun server.
Controllare la colonna Stato assegnato per ogni GPU per tutti i server. La colonna Stato assegnato può contenere uno di questi stati:
Pronto per l'assegnazione DDA. Indica che la GPU è disponibile per l'assegnazione DDA. Non è possibile usarlo per il partizionamento GPU.
Partizionato. Indica che la GPU è partizionabile.
Paravirtualizzazione. Indica che la GPU dispone della funzionalità del driver partizionato installata, ma SR-IOV nel server non è abilitato.
Non assegnabile. Indica che la GPU non è assegnabile perché è un dispositivo di tipo PCI o una porta switch datata.
Procedere nel flusso di lavoro del partizionamento GPU solo se la colonna Stato assegnato mostra Partizionato per le GPU in tutti i server del cluster.
Configurare il numero di partizioni GPU
Ogni GPU partizionabile include un set di numeri di partizioni validi predefiniti dal partner OEM. Non è possibile definire il numero di partizioni che può avere una GPU. Tuttavia, è possibile configurare il numero di partizioni su uno qualsiasi dei numeri validi dall'interno del set supportato.
Seguire questa procedura per configurare il numero di partizioni tramite Windows Admin Center:
Selezionare la scheda Partizioni GPU per configurare i numeri di partizioni. È anche possibile assegnare la partizione alle macchine virtuali e annullare l'assegnazione delle partizioni dalle macchine virtuali usando questa scheda.
Nota
Se nel cluster non sono disponibili GPU partizionabili o se il driver di partizionamento GPU corretto non è installato, la scheda Partizioni GPU mostra il messaggio seguente:
Non sono state trovate GPU partizionabili. Assicurarsi di disporre di una GPU con il driver GPU-P corretto per continuare.
Selezionare una GPU o una partizione GPU per mostrarne i dettagli nella sezione inferiore della pagina, in Dettagli elemento selezionato. Ad esempio, se si seleziona una GPU, vengono visualizzati il nome della GPU, l'ID GPU, il codificatore e il decodificatore disponibili, la VRAM disponibile, il numero di partizioni valido e il numero di partizioni corrente. Se si seleziona una partizione GPU, vengono visualizzati l'ID partizione, l'ID macchina virtuale, il percorso dell'istanza, la VRAM della partizione, il codificatore e il decodificatore della partizione.
Selezionare Configurare il numero di partizioni.
Viene visualizzata la pagina Configurare il numero di partizioni nelle GPU. Per ogni server vengono visualizzati i dispositivi GPU installati su di essi.
Selezionare un set di GPU omogenee. Un set di GPU omogenee è quello con GPU di dimensioni, produttore, numero di modello e numero di partizioni identici. Per impostazione predefinita, Windows Admin Center seleziona automaticamente un set di GPU omogenee se ne rileva uno, come illustrato nello screenshot seguente:
È possibile che venga visualizzato un avviso o un errore, a seconda delle selezioni effettuate:
Avviso. Se si deseleziona una o più GPU dal set omogeneo di GPU, Windows Admin Center visualizza un avviso, ma non impedisce di procedere. Il testo dell'avviso indica che non si stanno selezionando tutte le GPU e che il numero di partizioni potrebbe essere diverso (non consigliabile).
Avviso. Se non tutte le GPU in tutti i server hanno la stessa configurazione, Windows Admin Center genera un avviso. È necessario selezionare manualmente le GPU con la stessa configurazione per continuare.
Errore. Se si selezionano GPU con configurazioni diverse, Windows Admin Center restituisce un errore e non consente di procedere.
Errore. Se si seleziona una partizione GPU già assegnata a una macchina virtuale, Windows Admin Center restituisce un errore e non consente di procedere. Prima di continuare, è necessario annullare l'assegnazione della partizione dalla macchina virtuale. Vedere Annullare l'assegnazione di una partizione da una macchina virtuale.
Dopo aver selezionato un set omogeneo di GPU, selezionare il numero di partizioni dall'elenco a discesa Numero di partizioni. Questo elenco popola automaticamente i numeri di partizioni configurati dal produttore di GPU. I numeri visualizzati nell'elenco possono variare a seconda del tipo di GPU selezionato.
Non appena si seleziona un numero di partizioni diverso, viene visualizzata una descrizione comando sotto l'elenco a discesa, che visualizza in modo dinamico le dimensioni della VRAM che ottiene ogni partizione. Ad esempio, se la VRAM totale è di 16 GB per 16 partizioni nella GPU, la modifica del numero di partizioni da 16 a 8 assegna a ogni partizione 1,85 GB di VRAM.
Selezionare Configurare il numero di partizioni.
Dopo aver configurato il numero di partizioni, Windows Admin Center notifica che il numero di partizioni è stato configurato correttamente e visualizza nuovamente la scheda Partizioni GPU. È possibile visualizzare il nuovo numero di partizioni per la partizione GPU nella colonna Numero di partizioni.
Assegnare la partizione GPU a una macchina virtuale
Salvare i carichi di lavoro prima di assegnare la partizione alla macchina virtuale.
Nota
Attualmente, è possibile assegnare una sola partizione GPU a una macchina virtuale. Sia la macchina virtuale sia la partizione GPU devono trovarsi nello stesso computer host. È consigliabile pianificare in anticipo e determinare le dimensioni della partizione GPU in base ai requisiti di prestazioni del carico di lavoro.
È necessario salvare i carichi di lavoro prima di assegnare le partizioni. Se la macchina virtuale è attualmente attivata o in esecuzione, Windows Admin Center la disattiva automaticamente, assegna la partizione, quindi la riattiva automaticamente.
Nella scheda Partizioni GPU selezionare + Assegna partizione.
Viene visualizzata la pagina Assegna partizione GPU alla macchina virtuale.
Nell'elenco Scegliere il server selezionare il server in cui risiede la macchina virtuale. Questo elenco mostra tutti i server nel cluster.
Cercare e selezionare la macchina virtuale a cui assegnare la partizione GPU. L'elenco popola automaticamente le macchine virtuali che risiedono nel server selezionato nel passaggio 2.
Se una partizione GPU è già assegnata a una macchina virtuale, quella macchina virtuale non è selezionabile.
Selezionare tutte le macchine virtuali contemporaneamente selezionando la casella di controllo Seleziona tutto.
Selezionare le opzioni VRAM disponibili. Il valore in questo campo deve corrispondere al numero di partizioni configurato.
(Facoltativo, ma consigliato) Selezionare la casella di controllo Configura azione offline per forzare l'arresto se si vuole che la macchina virtuale sia altamente disponibile ed esegua il failover se il server host è inattivo.
Selezionare Assegna partizione. La partizione delle dimensioni VRAM selezionate viene assegnata alla macchina virtuale selezionata nel server host selezionato.
Dopo l'assegnazione della partizione, Windows Admin Center notifica che la partizione è stata assegnata correttamente e visualizza nuovamente la scheda Partizioni GPU. Nella scheda Partizioni GPU la macchina virtuale viene visualizzata nella riga della partizione GPU nel server in cui è installata.
Annullare l'assegnazione di una partizione da una macchina virtuale
È possibile annullare l'assegnazione di una partizione GPU dalla macchina virtuale se non è più necessaria per eseguire i carichi di lavoro. L'annullamento della partizione consente di liberare la risorsa di partizione GPU, che sarà possibile riassegnare in seguito a un'altra macchina virtuale.
È necessario salvare i carichi di lavoro prima di annullare l'assegnazione di partizioni.
Se la macchina virtuale è attivata o in esecuzione, Windows Admin Center la disattiva automaticamente, annulla l'assegnazione della partizione, quindi la riattiva automaticamente.
Seguire questa procedura per annullare l'assegnazione di una partizione da una macchina virtuale:
Nella scheda Partizioni GPU selezionare la partizione GPU di cui si desidera annullare l'assegnazione.
Selezionare - Annulla assegnazione partizione.
Viene visualizzata la pagina Annulla assegnazione partizione GPU dalla macchina virtuale.
Nell'elenco Scegliere il server selezionare il server con la partizione GPU di cui si desidera annullare l'assegnazione.
Nell'elenco Scegliere la macchina virtuale da cui annullare l'assegnazione della partizione cercare o selezionare la VM da cui annullare l'assegnazione della partizione.
Selezionare Annulla assegnazione partizione.
Dopo l'annullamento dell'assegnazione della partizione, Windows Admin Center notifica che l'assegnazione della partizione è stata annullata correttamente e visualizza nuovamente la scheda Partizioni GPU. Nella scheda Partizioni GPU la macchina virtuale da cui viene annullata l'assegnazione della partizione non mostra più la riga della partizione GPU.