La machine virtuelle de la série ND MI300X v5 est un nouvel ajout phare à la famille Azure GPU. Elle a été conçue pour la formation Deep Learning haut de gamme et les charges de travail IA générative et HPC Scale-up et Scale-out étroitement couplées.
La machine virtuelle de la série ND MI300X v5 commence par huit GPU AMD Instinct MI300 et deux processeurs Intel Xeon Scalable de quatrième génération pour un total de 96 cœurs physiques. Chaque GPU au sein de la machine virtuelle est ensuite connecté aux autres via des liaisons AMD Infinity Fabric de quatrième génération avec une bande passante de 128 Go/s par GPU et 896 Go/s de bande passante agrégée.
Les déploiements ND MI300X v5 peuvent effectuer un scale-up jusqu’à des milliers de GPU avec une bande passante d’interconnexion de 3,2 Tbit/s par machine virtuelle. Chaque GPU de la machine virtuelle est fourni avec sa propre connexion NVIDIA Quantum-2 CX7 InfiniBand dédiée et indépendante de la topologie. Ces connexions sont configurées automatiquement entre les machines virtuelles occupant le même groupe de machines virtuelles identiques, et prennent en charge GPUDirect RDMA.
Ces instances offrent d’excellentes performances pour de nombreux outils d’IA, de Machine Learning et d’analyse qui prennent en charge l’accélération GPU « prêts à l’emploi », tels que TensorFlow, Pytorch et d’autres infrastructures. En outre, l’interconnexion InfiniBand de Scale-out prend en charge un grand ensemble d’outils IA et HPC existants basés sur la bibliothèque RCCL (ROCm Communication Collectives Library) d’AMD pour un clustering transparent des GPU.
Spécifications de l’hôte
Élément
Quantité Compter des unités
Spécifications ID de la référence SKU, unités de performance, etc.
Processeur
96 processeurs virtuels
Intel Xeon (Sapphire Rapids) [x86-64]
Mémoire
1850 Gio
Stockage local
1 disque temporaire 8 disques NVMe
Disque temporaire de 1 000 Gio Disques NVMe de 28 000 Gio
1La vitesse de disque temporaire diffère souvent entre les opérations RR (lecture aléatoire) et RW (écriture aléatoire). Les opérations RR sont généralement plus rapides que les opérations RW. La vitesse RW est généralement inférieure à la vitesse RR sur les séries où seule la valeur de vitesse RR est répertoriée.
La capacité de stockage est indiquée en unités de Gio ou 1 024^3 octets. Lorsque vous comparez des disques mesurés en Go (1 000^3 octets) à des disques mesurés en Gio (1 024^3), n’oubliez pas que les nombres de capacité donnés en Gio peuvent paraitre inférieurs. Par exemple, 1 023 Gio = 1 098,4 Go.
Le débit de disque est mesuré en opérations d’entrée/sortie par seconde (IOPS) et Mbit/s où Mbit/s = 10^6 octets par seconde.
1Certaines tailles prennent en charge le bursting pour augmenter temporairement le niveau de performance du disque. Les vitesses de rafale peuvent être conservées jusqu’à 30 minutes à la fois.
La capacité de stockage est indiquée en unités de Gio ou 1 024^3 octets. Lorsque vous comparez des disques mesurés en Go (1 000^3 octets) à des disques mesurés en Gio (1 024^3), n’oubliez pas que les nombres de capacité donnés en Gio peuvent paraitre inférieurs. Par exemple, 1 023 Gio = 1 098,4 Go.
Le débit de disque est mesuré en opérations d’entrée/sortie par seconde (IOPS) et Mbit/s où Mbit/s = 10^6 octets par seconde.
Les disques de données peuvent fonctionner en mode avec ou sans mise en cache. En cas de fonctionnement du disque de données avec mise en cache, le mode de mise en cache hôte est défini sur ReadOnly ou ReadWrite. En cas de fonctionnement du disque de données sans mise en cache, le mode de mise en cache hôte est défini sur Aucun.
La bande passante réseau attendue est la bande passante agrégée maximale qui est allouée par type de machine virtuelle entre toutes les cartes réseau, pour toutes les destinations. Pour plus d’informations, consultez Bande passante réseau des machines virtuelles
Les limites supérieures ne sont pas garanties. Les limites permettent de sélectionner le type de machine virtuelle approprié pour l’application prévue. Les performances réseau réelles dépendent de nombreux facteurs, notamment la congestion du réseau, les charges de l’application, ainsi que les paramètres réseau. Pour plus d’informations sur l’optimisation du débit du réseau, consultez Optimiser le débit du réseau pour les machines virtuelles Azure.
Pour atteindre la performance réseau attendue sous Linux ou Windows, il peut être nécessaire de sélectionner une version spécifique ou d’optimiser votre machine virtuelle. Pour plus d’informations, consultez Test de bande passante/débit (NTTTCP).
Informations d’accélérateur (GPU, FPGA, etc.) pour chaque taille
Lisez-en davantage sur les Unités de calcul Azure (ACU) pour découvrir comment comparer les performances de calcul entre les références Azure.
Consultez Hôtes Azure Dedicated Host pour connaître les serveurs physiques capables d’héberger une ou plusieurs machines virtuelles attribuées à un abonnement Azure.