Partager via


Outils d’apprentissage automatique et de science des données sur les machines virtuelles de science des données (DSVM) Azure

Les machines virtuelles Azure DSVM (Data Science Virtual Machine) offrent un ensemble complet d’outils et de bibliothèques de Machine Learning. Ces ressources sont disponibles dans les langages courants, tels que Python, R et Julia.

La machine virtuelle DSVM prend en charge les outils et bibliothèques de Machine Learning suivants :

SDK Azure Machine Learning pour Python

Pour obtenir des informations de référence complètes, consultez l’article Kit de développement logiciel (SDK) Azure Machine Learning pour Python.

Catégorie Valeur
Qu’est-ce que c’est ? Vous pouvez utiliser le service cloud Azure Machine Learning pour développer et déployer des modèles Machine Learning. Vous pouvez utiliser le SDK Python pour suivre vos modèles pendant les opérations de création, d’entraînement, de mise à l’échelle et de gestion que vous effectuez sur ceux-ci. Déployez des modèles en tant que conteneurs et exécutez-les dans le cloud, localement, ou sur Azure IoT Edge.
Éditions prises en charge Windows (environnement Conda : AzureML), Linux (environnement Conda : py36)
Utilisations classiques Plateforme de Machine Learning générale
Comment fonctionne la configuration ou l’installation ? Installé avec prise en charge GPU
Comment l’utiliser ou l’exécuter Comme kit SDK Python et dans Azure CLI. Activez pour l’environnement conda AzureML sur l’édition Windows ou activez pour py36 sur l’édition Linux.
Liens vers des exemples Vous trouverez des exemples de notebooks Jupyter dans le répertoire AzureML, sous notebooks.

H2O

Category Valeur
Qu’est-ce que c’est ? Une plateforme d’IA open source prenant en charge des fonctionnalités de Machine Learning distribuées, rapides et évolutives.
Versions prises en charge Linux
Utilisations classiques Machine Learning scalable, distribué et à usage général
Comment fonctionne la configuration ou l’installation ? H2O est installé dans /dsvm/tools/h2o.
Comment l’utiliser ou l’exécuter Connectez-vous à la machine virtuelle avec X2Go. Démarrez un nouveau terminal et exécutez java -jar /dsvm/tools/h2o/current/h2o.jar. Ensuite, démarrez un navigateur web et connectez-vous à http://localhost:54321.
Liens vers des exemples Vous trouverez des exemples sur la machine virtuelle dans Jupyter sous le répertoire h2o.

Il existe plusieurs autres bibliothèques de Machine Learning sur des machines virtuelles DSVM, par exemple le package scikit-learn très prisé qui fait partie de la distribution Anaconda Python pour les machines virtuelles DSVM. Pour obtenir la liste des packages disponibles dans Python, R et Julia, exécutez le gestionnaire de package correspondant.

LightGBM

Category Valeur
Qu’est-ce que c’est ? Un framework de boosting de gradient (GBDT, GBRT, GBM ou MART) rapide, distribué et hautes performances basé sur des algorithmes d’arbre de décision. Les tâches de Machine Learning (classement, classification, etc.) l’utilisent.
Versions prises en charge Windows, Linux
Utilisations classiques Framework de boosting de gradient à usage général
Comment fonctionne la configuration ou l’installation ? LightGBM est installé en tant que package Python sur Windows. Sur Linux, l’exécutable de ligne de commande se trouve dans /opt/LightGBM/lightgbm. Le package R est installé et les packages Python sont installés.
Liens vers des exemples Guide LightGBM

Rattle

Category Valeur
Qu’est-ce que c’est ? Une interface graphique utilisateur pour l’exploration de données qui utilise R.
Éditions prises en charge Windows, Linux
Utilisations classiques Outil général d’exploration de données doté d’une interface utilisateur pour R
Comment l’utiliser ou l’exécuter En tant qu’outil d’interface utilisateur. Sur Windows, démarrez une invite de commandes, exécutez R, puis exécutez rattle() dans R. Sur Linux, connectez-vous avec X2Go, démarrez un terminal, exécutez R, puis dans R, exécutez rattle().
Liens vers des exemples Rattle

Vowpal Wabbit

Category Valeur
Qu’est-ce que c’est ? Une bibliothèque système d’entraînement rapide, open source et hors cœur
Éditions prises en charge Windows, Linux
Utilisations classiques Bibliothèque de Machine Learning générale
Comment fonctionne la configuration ou l’installation ? Windows : programme d’installation MSI
Linux : apt-get
Comment l’utiliser ou l’exécuter En tant qu’outil en ligne de commande de chemin (C:\Program Files\VowpalWabbit\vw.exe sur Windows, /usr/bin/vw sur Linux)
Liens vers des exemples Exemples VowPal Wabbit

Weka

Category Valeur
Qu’est-ce que c’est ? Une collection d’algorithmes de Machine Learning pour les tâches d’exploration de données. Vous pouvez appliquer directement les algorithmes ou les appeler à partir de votre propre code Java. Weka contient des outils pour le prétraitement des données, la classification, la régression, le clustering, les règles d’association et la visualisation.
Éditions prises en charge Windows, Linux
Utilisations classiques Outil de Machine Learning général
Comment l’utiliser ou l’exécuter Sur Windows, recherchez Weka dans le menu Démarrer. Sur Linux, connectez-vous avec X2Go, puis accédez à Applications>Développement>Weka.
Liens vers des exemples Exemples Weka

XGBoost

Category Valeur
Qu’est-ce que c’est ? Une bibliothèque de boosting de gradient (GBDT, GBRT ou GBM) rapide, portable et distribuée pour Python, R, Java, Scala, C++, etc. S’exécute sur une seule machine, et sur Apache Hadoop et Spark.
Éditions prises en charge Windows, Linux
Utilisations classiques Bibliothèque de Machine Learning générale
Comment fonctionne la configuration ou l’installation ? Installé avec prise en charge GPU
Comment l’utiliser ou l’exécuter Comme bibliothèque Python (2.7 et 3.6+), package R et outil en ligne de commande sur le chemin (C:\dsvm\tools\xgboost\bin\xgboost.exe pour Windows et /dsvm/tools/xgboost/xgboost pour Linux)
Liens vers des exemples Des exemples sont fournis sur la machine virtuelle, dans /dsvm/tools/xgboost/demo sur Linux et C:\dsvm\tools\xgboost\demo sur Windows.