Qu’est-ce qu’Azure Data Science Virtual Machine pour Linux et Windows ?
Data Science Virtual Machine (DSVM) est une image de machine virtuelle personnalisée qui est disponible sur la plateforme cloud Azure et qui peut gérer la science des données. Elle inclut de nombreux outils populaires de science des données qui sont préinstallés et préconfigurés afin d’accélérer la création d’applications intelligentes à des fins d’analyse avancée.
La Data Science Virtual Machine est disponible sur :
- Windows Server 2019
- Windows Server 2022
- Ubuntu 20.04 LTS
De plus, nous offrons Azure DSVM pour PyTorch, une image Ubuntu 20.04 de la Place de marché Azure qui est optimisée pour les grandes charges de travail distribuées de Deep Learning. Cette DSVM préinstallée est validée avec la dernière version de PyTorch pour réduire les coûts d’installation et accélérer le délai de rentabilisation. Elle est fournie avec différentes fonctionnalités d’optimisation :
- ONNX Runtime
- DeepSpeed
- MSCCL
- ORTMoE
- Fairscale
- Nvidia Apex
- Une pile à jour avec les dernières versions compatibles d’Ubuntu, Python, PyTorch et CUDA
Comparaison avec Azure Machine Learning
La DSVM est une image de machine virtuelle personnalisée pour la Science des données, mais Azure Machine Learning est une plateforme de bout en bout qui couvre :
- Capacité de calcul managée
- Compute Instances (Instances de calcul)
- Clusters de calcul pour les tâches ML distribuées
- Clusters d’inférence pour la notation en temps réel
- Magasins de données (par exemple Blob, ADLS Gen2, SQL DB)
- Suivi des expériences
- La gestion des modèles
- Notebooks
- Environnements (gérer les dépendances Conda et R)
- L’étiquetage
- Pipelines (automatiser les workflows de science des données de bout en bout)
Comparaison avec les instances de calcul Azure Machine Learning
Les instances de calcul Azure Machine Learning sont des images de machine virtuelle entièrement configurées et managées, tandis que la DSVM est une machine virtuelle non managée.
Principales différences entre une DSVM et une instance de calcul Azure Machine Learning :
Fonctionnalité | Science des données Machine virtuelle |
Azure Machine Learning Instance de calcul |
---|---|---|
Entièrement managée | Non | Oui |
Prise en charge de la langue | Python, R, Julia, SQL, C#, Java, Node.js, F# |
Python et R |
Système d'exploitation | Ubuntu Windows |
Ubuntu |
Option GPU préconfigurée | Oui | Oui |
Option de scale-up | Oui | Oui |
Accès SSH | Oui | Oui |
Accès RDP | Oui | Non |
Intégré Notebooks hébergés |
Non (nécessite une configuration supplémentaire) |
Oui |
Authentification unique intégrée | Aucune (nécessite une configuration supplémentaire) |
Oui |
Collaboration intégrée | Non | Oui |
Outils préinstallés | Jupyter(lab), VS Code, Visual Studio, PyCharm, Juno, Power BI Desktop, SSMS, Microsoft Office 365, Apache Drill |
Jupyter(lab) |
Exemples de cas d’usage client de DSVM
Expérimentation et évaluation à court terme
La DSVM peut évaluer ou apprendre de nouveaux outils de science des données. Essayez certains de nos exemples et procédures pas à pas publiés.
Deep Learning avec les GPU
Dans la DSVM, vos modèles de formation peuvent utiliser des algorithmes de Deep Learning sur du matériel basé sur des unités de traitement graphique (GPU). Si vous tirez parti des fonctionnalités de mise à l’échelle des machines virtuelles de la plateforme Azure, la DSVM vous aide à exploiter le matériel basé sur GPU dans le cloud en fonction de vos besoins. Vous pouvez basculer sur une machine virtuelle basée sur GPU quand vous effectuez l’apprentissage de grands modèles ou quand vous avez besoin d’une grande rapidité de calcul tout en conservant le même disque de système d’exploitation. Vous pouvez choisir l’une des références SKU de machines virtuelles avec GPU de la série N avec DSVM. Les comptes gratuits Azure ne prennent pas en charge les références SKU de machines virtuelles où le GPU est activé.
Une DSVM édition Windows est préinstallée avec les pilotes GPU, les infrastructures et les versions GPU des infrastructures de Deep Learning. Sur les éditions Linux, le deep learning sur les GPU est activé sur les DSVM Ubuntu.
Vous pouvez également déployer l’édition Ubuntu ou Windows de la DSVM sur une machine virtuelle Azure qui n’est pas basée sur des GPU. Dans ce cas, toutes les infrastructures de Deep Learning repassent en mode UC.
Découvrez-en plus sur les frameworks de deep learning et d’intelligence artificielle disponibles.
Formation et éducation de la science des données
Les formateurs et instructeurs en entreprise qui enseignent la science des données fournissent généralement une image de machine virtuelle. Avec l’image, les étudiants disposent d’une installation cohérente et les exemples fonctionnent comme prévu.
La DSVM crée un environnement à la demande avec une configuration cohérente qui atténue les problèmes de support et d’incompatibilité. Ceci est d’autant plus bénéfique dans les cas où ces environnements doivent être créés fréquemment, en particulier lors de formations plus courtes.
Que comprend la DSVM ?
Pour plus d’informations, consultez cette liste complète des outils sur les DSVM Windows et Linux.
Étapes suivantes
Pour plus d’informations, visitez ces ressources :