Série de tailles NDasrA100_v4

Article
10/19/2024

La machine virtuelle de série ND A100 v4 est une nouveauté phare de la famille de processeurs graphiques Azure. Ces tailles sont conçues pour l’entraînement Deep Learning hautes performances, et pour des charges de travail HPC avec scale-up et scale-out étroitement couplées.

La série ND A100 v4 commence avec une machine virtuelle unique et huit GPU NVIDIA Ampere A100 Tensor Core de 40 Go. Les déploiements A100 v4 peuvent monter en puissance jusqu’à des milliers de GPU avec une bande passante d’interconnexion de 1,6 To/s par machine virtuelle. Chaque GPU au sein de la machine virtuelle est fourni avec sa propre connexion indépendante de la topologie NVIDIA Mellanox HDR InfiniBand 200 Go/s. Ces connexions sont configurées automatiquement entre les machines virtuelles occupant le même groupe de machines virtuelles identiques, et prennent en charge GPU Direct RDMA.

Chaque GPU est doté d’une connectivité NVLINK 3.0 pour la communication au sein de la machine virtuelle, en s’appuyant sur 96 cœurs de processeur physiques AMD Epyc™ 7V12 (Rome) de 2e génération.

Ces instances offrent d’excellentes performances pour de nombreux outils d’IA, de ML et d’analyse qui prennent en charge l’accélération GPU « prêts à l’emploi », tels que TensorFlow, Pytorch, Caffe, RAPIDS et d’autres frameworks. En outre, l’interconnexion InfiniBand avec scale-out prend en charge un grand nombre d’outils IA et HPC existants basés sur les bibliothèques de communication NCCL2 de NVIDIA pour un clustering facilité des GPU.

Spécifications de l’hôte

Élément	Quantité ^{Compter des unités}	Spécifications ^{ID de la référence SKU, unités de performance, etc.}
Processeur	96 processeurs virtuels	AMD EPYC 7V12 (Rome) [x86-64]
Mémoire	900 Gio
Stockage local	1 disque	6 000 Gio
Stockage à distance	32 disques	80 000 IOPS 800 Mo/s
Network (Réseau)	8 cartes réseau	24 000 Mbits/s
Accélérateurs	8 GPU	GPU Nvidia A100 (40 Go)

Prise en charge des fonctionnalités

Stockage Premium : pris en charge
Mise en cache de Stockage Premium : prise en charge
Migration dynamique : non prise en charge
Mises à jour avec préservation de la mémoire : non prises en charge
Machines virtuelles de deuxième génération : prises en charge
Machines virtuelles de 1re génération : non prises en charge
Performances réseau accélérées : pris en charge
Disque de système d’exploitation éphémère : pris en charge
Virtualisation imbriquée : non pris en charge

Tailles des séries

processeurs virtuels (Qty.) et mémoire pour chaque taille

Nom de la taille	Processeurs virtuels (Qté.)	Mémoire (Go)
Standard_ND96asr_A100_v4	96	900

Ressources de base des VMs

Consulter les quotas de processeurs virtuels

Informations de stockage locales (temporaires) pour chaque taille

Nom de la taille	Nombre maximal de disques de stockage temporaire (quantité)	Taille de disque temporaire (Gio)
Standard_ND96asr_A100_v4	1	6000

Ressources de stockage

Définitions de table

¹La vitesse de disque temporaire diffère souvent entre les opérations RR (lecture aléatoire) et RW (écriture aléatoire). Les opérations RR sont généralement plus rapides que les opérations RW. La vitesse RW est généralement inférieure à la vitesse RR sur les séries où seule la valeur de vitesse RR est répertoriée.
La capacité de stockage est indiquée en unités de Gio ou 1 024^3 octets. Lorsque vous comparez des disques mesurés en Go (1 000^3 octets) à des disques mesurés en Gio (1 024^3), n’oubliez pas que les nombres de capacité donnés en Gio peuvent paraitre inférieurs. Par exemple, 1 023 Gio = 1 098,4 Go.
Le débit de disque est mesuré en opérations d’entrée/sortie par seconde (IOPS) et Mbit/s où Mbit/s = 10^6 octets par seconde.
Pour découvrir comment obtenir les meilleures performances de stockage pour vos machines virtuelles, consultez Performances des disques et des machines virtuelles.

Informations sur le stockage à distance (non mis en cache) pour chaque taille

Nom de la taille	Nombre maximal de disques de stockage distant (quantité)	IOPS de disque non mis en cache	Vitesse de disque non mis en cache (Mbits/s)
Standard_ND96asr_A100_v4	32	80000	800

Ressources de stockage

Définitions de table

¹Certaines tailles prennent en charge le bursting pour augmenter temporairement le niveau de performance du disque. Les vitesses de rafale peuvent être conservées jusqu’à 30 minutes à la fois.
²Stockage spécial fait référence au stockage disque Ultra ou SSD Premium v2.
La capacité de stockage est indiquée en unités de Gio ou 1 024^3 octets. Lorsque vous comparez des disques mesurés en Go (1 000^3 octets) à des disques mesurés en Gio (1 024^3), n’oubliez pas que les nombres de capacité donnés en Gio peuvent paraitre inférieurs. Par exemple, 1 023 Gio = 1 098,4 Go.
Le débit de disque est mesuré en opérations d’entrée/sortie par seconde (IOPS) et Mbit/s où Mbit/s = 10^6 octets par seconde.
Les disques de données peuvent fonctionner en mode avec ou sans mise en cache. En cas de fonctionnement du disque de données avec mise en cache, le mode de mise en cache hôte est défini sur ReadOnly ou ReadWrite. En cas de fonctionnement du disque de données sans mise en cache, le mode de mise en cache hôte est défini sur Aucun.
Pour découvrir comment obtenir les meilleures performances de stockage pour vos machines virtuelles, consultez Performances des disques et des machines virtuelles.

Informations sur l’interface réseau pour chaque taille

Nom de la taille	Nombre maximal de cartes réseau (Qté.)	Bande passante maximale (Mbits/s)
Standard_ND96asr_A100_v4	8	24 000

Ressources réseau

Définitions de table

La bande passante réseau attendue est la bande passante agrégée maximale qui est allouée par type de machine virtuelle entre toutes les cartes réseau, pour toutes les destinations. Pour plus d’informations, consultez Bande passante réseau des machines virtuelles
Les limites supérieures ne sont pas garanties. Les limites permettent de sélectionner le type de machine virtuelle approprié pour l’application prévue. Les performances réseau réelles dépendent de nombreux facteurs, notamment la congestion du réseau, les charges de l’application, ainsi que les paramètres réseau. Pour plus d’informations sur l’optimisation du débit du réseau, consultez Optimiser le débit du réseau pour les machines virtuelles Azure.
Pour atteindre la performance réseau attendue sous Linux ou Windows, il peut être nécessaire de sélectionner une version spécifique ou d’optimiser votre machine virtuelle. Pour plus d’informations, consultez Test de bande passante/débit (NTTTCP).

Nom de la taille	Accélérateurs (Qté.)	Mémoire de l’accélérateur (Go)
Standard_ND96asr_A100_v4	8	320

Autres informations de taille

Liste de toutes les tailles disponibles : Tailles

Calculatrice de prix : Calculatrice de prix

Informations sur les types de disques : Types de disques

Étapes suivantes

Lisez-en davantage sur les Unités de calcul Azure (ACU) pour découvrir comment comparer les performances de calcul entre les références Azure.

Consultez Hôtes Azure Dedicated Host pour connaître les serveurs physiques capables d’héberger une ou plusieurs machines virtuelles attribuées à un abonnement Azure.

Commencez ici pour découvrir comment Superviser les machines virtuelles Azure.

Partager via

Série de tailles NDasrA100_v4

Spécifications de l’hôte

Prise en charge des fonctionnalités

Tailles des séries

Ressources de base des VMs

Ressources de stockage

Définitions de table

Ressources de stockage

Définitions de table

Ressources réseau

Définitions de table

Autres informations de taille

Étapes suivantes

Commentaires

Ressources supplémentaires