Outils d’apprentissage automatique et de science des données sur les machines virtuelles de science des données (DSVM) Azure

Article
09/03/2024

Les machines virtuelles Azure DSVM (Data Science Virtual Machine) offrent un ensemble complet d’outils et de bibliothèques de Machine Learning. Ces ressources sont disponibles dans les langages courants, tels que Python, R et Julia.

La machine virtuelle DSVM prend en charge les outils et bibliothèques de Machine Learning suivants :

SDK Azure Machine Learning pour Python

Pour obtenir des informations de référence complètes, consultez l’article Kit de développement logiciel (SDK) Azure Machine Learning pour Python.

Catégorie	Valeur
Qu’est-ce que c’est ?	Vous pouvez utiliser le service cloud Azure Machine Learning pour développer et déployer des modèles Machine Learning. Vous pouvez utiliser le SDK Python pour suivre vos modèles pendant les opérations de création, d’entraînement, de mise à l’échelle et de gestion que vous effectuez sur ceux-ci. Déployez des modèles en tant que conteneurs et exécutez-les dans le cloud, localement, ou sur Azure IoT Edge.
Éditions prises en charge	Windows (environnement Conda : AzureML), Linux (environnement Conda : py36)
Utilisations classiques	Plateforme de Machine Learning générale
Comment fonctionne la configuration ou l’installation ?	Installé avec prise en charge GPU
Comment l’utiliser ou l’exécuter	Comme kit SDK Python et dans Azure CLI. Activez pour l’environnement conda `AzureML` sur l’édition Windows ou activez pour `py36` sur l’édition Linux.
Liens vers des exemples	Vous trouverez des exemples de notebooks Jupyter dans le répertoire `AzureML`, sous notebooks.

H2O

Category	Valeur
Qu’est-ce que c’est ?	Une plateforme d’IA open source prenant en charge des fonctionnalités de Machine Learning distribuées, rapides et évolutives.
Versions prises en charge	Linux
Utilisations classiques	Machine Learning scalable, distribué et à usage général
Comment fonctionne la configuration ou l’installation ?	H2O est installé dans `/dsvm/tools/h2o`.
Comment l’utiliser ou l’exécuter	Connectez-vous à la machine virtuelle avec X2Go. Démarrez un nouveau terminal et exécutez `java -jar /dsvm/tools/h2o/current/h2o.jar`. Ensuite, démarrez un navigateur web et connectez-vous à `http://localhost:54321`.
Liens vers des exemples	Vous trouverez des exemples sur la machine virtuelle dans Jupyter sous le répertoire `h2o`.

Il existe plusieurs autres bibliothèques de Machine Learning sur des machines virtuelles DSVM, par exemple le package scikit-learn très prisé qui fait partie de la distribution Anaconda Python pour les machines virtuelles DSVM. Pour obtenir la liste des packages disponibles dans Python, R et Julia, exécutez le gestionnaire de package correspondant.

LightGBM

Category	Valeur
Qu’est-ce que c’est ?	Un framework de boosting de gradient (GBDT, GBRT, GBM ou MART) rapide, distribué et hautes performances basé sur des algorithmes d’arbre de décision. Les tâches de Machine Learning (classement, classification, etc.) l’utilisent.
Versions prises en charge	Windows, Linux
Utilisations classiques	Framework de boosting de gradient à usage général
Comment fonctionne la configuration ou l’installation ?	LightGBM est installé en tant que package Python sur Windows. Sur Linux, l’exécutable de ligne de commande se trouve dans `/opt/LightGBM/lightgbm`. Le package R est installé et les packages Python sont installés.
Liens vers des exemples	Guide LightGBM

Rattle

Category	Valeur
Qu’est-ce que c’est ?	Une interface graphique utilisateur pour l’exploration de données qui utilise R.
Éditions prises en charge	Windows, Linux
Utilisations classiques	Outil général d’exploration de données doté d’une interface utilisateur pour R
Comment l’utiliser ou l’exécuter	En tant qu’outil d’interface utilisateur. Sur Windows, démarrez une invite de commandes, exécutez R, puis exécutez `rattle()` dans R. Sur Linux, connectez-vous avec X2Go, démarrez un terminal, exécutez R, puis dans R, exécutez `rattle()`.
Liens vers des exemples	Rattle

Vowpal Wabbit

Category	Valeur
Qu’est-ce que c’est ?	Une bibliothèque système d’entraînement rapide, open source et hors cœur
Éditions prises en charge	Windows, Linux
Utilisations classiques	Bibliothèque de Machine Learning générale
Comment fonctionne la configuration ou l’installation ?	Windows : programme d’installation MSI Linux : apt-get
Comment l’utiliser ou l’exécuter	En tant qu’outil en ligne de commande de chemin (`C:\Program Files\VowpalWabbit\vw.exe` sur Windows, `/usr/bin/vw` sur Linux)
Liens vers des exemples	Exemples VowPal Wabbit

Weka

Category	Valeur
Qu’est-ce que c’est ?	Une collection d’algorithmes de Machine Learning pour les tâches d’exploration de données. Vous pouvez appliquer directement les algorithmes ou les appeler à partir de votre propre code Java. Weka contient des outils pour le prétraitement des données, la classification, la régression, le clustering, les règles d’association et la visualisation.
Éditions prises en charge	Windows, Linux
Utilisations classiques	Outil de Machine Learning général
Comment l’utiliser ou l’exécuter	Sur Windows, recherchez Weka dans le menu Démarrer. Sur Linux, connectez-vous avec X2Go, puis accédez à Applications>Développement>Weka.
Liens vers des exemples	Exemples Weka

XGBoost

Category	Valeur
Qu’est-ce que c’est ?	Une bibliothèque de boosting de gradient (GBDT, GBRT ou GBM) rapide, portable et distribuée pour Python, R, Java, Scala, C++, etc. S’exécute sur une seule machine, et sur Apache Hadoop et Spark.
Éditions prises en charge	Windows, Linux
Utilisations classiques	Bibliothèque de Machine Learning générale
Comment fonctionne la configuration ou l’installation ?	Installé avec prise en charge GPU
Comment l’utiliser ou l’exécuter	Comme bibliothèque Python (2.7 et 3.6+), package R et outil en ligne de commande sur le chemin (`C:\dsvm\tools\xgboost\bin\xgboost.exe` pour Windows et `/dsvm/tools/xgboost/xgboost` pour Linux)
Liens vers des exemples	Des exemples sont fournis sur la machine virtuelle, dans `/dsvm/tools/xgboost/demo` sur Linux et `C:\dsvm\tools\xgboost\demo` sur Windows.

Partager via