Outils d’apprentissage automatique et de science des données sur les machines virtuelles de science des données (DSVM) Azure
Article
Les machines virtuelles Azure DSVM (Data Science Virtual Machine) offrent un ensemble complet d’outils et de bibliothèques de Machine Learning. Ces ressources sont disponibles dans les langages courants, tels que Python, R et Julia.
La machine virtuelle DSVM prend en charge les outils et bibliothèques de Machine Learning suivants :
Vous pouvez utiliser le service cloud Azure Machine Learning pour développer et déployer des modèles Machine Learning. Vous pouvez utiliser le SDK Python pour suivre vos modèles pendant les opérations de création, d’entraînement, de mise à l’échelle et de gestion que vous effectuez sur ceux-ci. Déployez des modèles en tant que conteneurs et exécutez-les dans le cloud, localement, ou sur Azure IoT Edge.
Éditions prises en charge
Windows (environnement Conda : AzureML), Linux (environnement Conda : py36)
Utilisations classiques
Plateforme de Machine Learning générale
Comment fonctionne la configuration ou l’installation ?
Installé avec prise en charge GPU
Comment l’utiliser ou l’exécuter
Comme kit SDK Python et dans Azure CLI. Activez pour l’environnement conda AzureML sur l’édition Windows ou activez pour py36 sur l’édition Linux.
Liens vers des exemples
Vous trouverez des exemples de notebooks Jupyter dans le répertoire AzureML, sous notebooks.
H2O
Category
Valeur
Qu’est-ce que c’est ?
Une plateforme d’IA open source prenant en charge des fonctionnalités de Machine Learning distribuées, rapides et évolutives.
Versions prises en charge
Linux
Utilisations classiques
Machine Learning scalable, distribué et à usage général
Comment fonctionne la configuration ou l’installation ?
H2O est installé dans /dsvm/tools/h2o.
Comment l’utiliser ou l’exécuter
Connectez-vous à la machine virtuelle avec X2Go. Démarrez un nouveau terminal et exécutez java -jar /dsvm/tools/h2o/current/h2o.jar. Ensuite, démarrez un navigateur web et connectez-vous à http://localhost:54321.
Liens vers des exemples
Vous trouverez des exemples sur la machine virtuelle dans Jupyter sous le répertoire h2o.
Il existe plusieurs autres bibliothèques de Machine Learning sur des machines virtuelles DSVM, par exemple le package scikit-learn très prisé qui fait partie de la distribution Anaconda Python pour les machines virtuelles DSVM. Pour obtenir la liste des packages disponibles dans Python, R et Julia, exécutez le gestionnaire de package correspondant.
LightGBM
Category
Valeur
Qu’est-ce que c’est ?
Un framework de boosting de gradient (GBDT, GBRT, GBM ou MART) rapide, distribué et hautes performances basé sur des algorithmes d’arbre de décision. Les tâches de Machine Learning (classement, classification, etc.) l’utilisent.
Versions prises en charge
Windows, Linux
Utilisations classiques
Framework de boosting de gradient à usage général
Comment fonctionne la configuration ou l’installation ?
LightGBM est installé en tant que package Python sur Windows. Sur Linux, l’exécutable de ligne de commande se trouve dans /opt/LightGBM/lightgbm. Le package R est installé et les packages Python sont installés.
Une interface graphique utilisateur pour l’exploration de données qui utilise R.
Éditions prises en charge
Windows, Linux
Utilisations classiques
Outil général d’exploration de données doté d’une interface utilisateur pour R
Comment l’utiliser ou l’exécuter
En tant qu’outil d’interface utilisateur. Sur Windows, démarrez une invite de commandes, exécutez R, puis exécutez rattle() dans R. Sur Linux, connectez-vous avec X2Go, démarrez un terminal, exécutez R, puis dans R, exécutez rattle().
Une collection d’algorithmes de Machine Learning pour les tâches d’exploration de données. Vous pouvez appliquer directement les algorithmes ou les appeler à partir de votre propre code Java. Weka contient des outils pour le prétraitement des données, la classification, la régression, le clustering, les règles d’association et la visualisation.
Éditions prises en charge
Windows, Linux
Utilisations classiques
Outil de Machine Learning général
Comment l’utiliser ou l’exécuter
Sur Windows, recherchez Weka dans le menu Démarrer. Sur Linux, connectez-vous avec X2Go, puis accédez à Applications>Développement>Weka.
Une bibliothèque de boosting de gradient (GBDT, GBRT ou GBM) rapide, portable et distribuée pour Python, R, Java, Scala, C++, etc. S’exécute sur une seule machine, et sur Apache Hadoop et Spark.
Éditions prises en charge
Windows, Linux
Utilisations classiques
Bibliothèque de Machine Learning générale
Comment fonctionne la configuration ou l’installation ?
Installé avec prise en charge GPU
Comment l’utiliser ou l’exécuter
Comme bibliothèque Python (2.7 et 3.6+), package R et outil en ligne de commande sur le chemin (C:\dsvm\tools\xgboost\bin\xgboost.exe pour Windows et /dsvm/tools/xgboost/xgboost pour Linux)
Liens vers des exemples
Des exemples sont fournis sur la machine virtuelle, dans /dsvm/tools/xgboost/demo sur Linux et C:\dsvm\tools\xgboost\demo sur Windows.