Notes de publication du kit SDK Python Azure Machine Learning
Dans cet article, découvrez les versions du kit SDK Python Azure Machine Learning. Pour obtenir le contenu complet de la référence SDK, consultez la page de référence du SDK principal pour Python d’Azure Machine Learning.
Flux RSS : Recevez une notification quand cette page est mise à jour en copiant et collant l’URL suivante dans votre lecteur de flux : https://zcusa.951200.xyz/api/search/rss?search=%22Azure+machine+learning+release+notes%22&locale=en-us
2024-10-18
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.58.0
Prise en charge de Python 3.11
2024-08-05
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.57.0
AutoML prend en charge scikit-learn version 1.5.1
2024-04-29
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.56.0
- azureml-core
- azureml-defaults
- Épingle azureml-inference-server-http à 1.0.0 dans azureml-defaults.
- azureml-interpret
- mise à jour du package azureml-interpret pour interpréter-community 0.31.*
- azureml-responsibleai
- mise à jour d’un environnement commun et d’un package azureml-responsibleai pour raiwidgets et responsibleai 0.33.0
- Augmenter les versions des dépendances responsables et fairlearn
2024-01-29
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.55.0
- azureml-core
- azureml-defaults
- Épingle azureml-inference-server-http à 1.0.0 dans azureml-defaults.
- azureml-interpret
- mise à jour du package azureml-interpret pour interpréter-community 0.31.*
- azureml-responsibleai
- mise à jour d’un environnement commun et d’un package azureml-responsibleai pour raiwidgets et responsibleai 0.33.0
- Augmenter les versions des dépendances responsables et fairlearn
2023-11-13
- azureml-automl-core, azureml-automl-runtime, azureml-contrib-automl-dnn-forecasting, azureml-train-automl-client, azureml-train-automl-runtime, azureml-training-tabular
- statsmodels, pandas et scipy ont été mis à niveau vers les versions 1.13, 1.3.5 et 1.10.1. fbprophet 0.7.1 a été remplacé par prophet 1.1.4. Lors du chargement d’un modèle dans un environnement local, les versions de ces packages doivent correspondre aux versions auxquels le modèle a été formé.
- azureml-core, azureml-pipeline-core, azureml-pipeline-steps
- AzureML-Pipeline : ajout d’un avertissement pour le paramètre
init_scripts
à l’étape Databricks, ce qui vous avertit de sa dépréciation à venir.
- AzureML-Pipeline : ajout d’un avertissement pour le paramètre
- azureml-interpret
- Package azureml-interpret mis à jour vers interpret-community 0.30.*
- azureml-mlflow
- feat : ajout de
AZUREML_BLOB_MAX_SINGLE_PUT_SIZE
pour contrôler la taille en octets des blocs de chargement. L’abaissement de cette valeur par défaut (64*1024*1024
qui est de 64 Mo) peut résoudre les problèmes où les opérations d’écriture échouent en raison de délais d’attente. - La prise en charge du chargement et du téléchargement de modèles à partir de registres AzureML est actuellement expérimentale
- Ajout de la prise en charge des utilisateurs qui souhaitent télécharger ou charger un modèle à partir de registres AML
- feat : ajout de
21-08-2023
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.53.0
- azureml-automl-core
- Prise en charge des fonctionnalités/régresseurs connus au moment de la prévision dans les modèles TCN de prévision AutoML.
- azureml-automl-dnn-vision
- Activer les indicateurs pour log_training_metrics et log_validation_loss pour la détection d’objets automl et la segmentation instance
- azureml-contrib-automl-dnn-forecasting
- Prise en charge des fonctionnalités/régresseurs connus au moment de la prévision dans les modèles TCN de prévision AutoML.
- azureml-core
- Python 3.7 a atteint la fin de vie le 27 juin 2023. Par conséquent, la version 3.7 sera déconseillée dans azureml-core à partir d’octobre 2023 et azureml-core prendra fin à la prise en charge de la version 3.7 en février 2024.
- azureml-mlflow
- Correctif pour le chargement de modèles avec les API MLflow load_model lors du passage d’un URI AzureML
- azureml-pipeline-core
- Ignorez l’exécution enfant et l’erreur du journal lorsque l’exécution enfant de la charge a échoué (par exemple, 404) à l’aide de
PipelineRun.get_pipeline_runs
. PipelineEndpoint.list
introduit un nouveau paramètremax_results
de type int ,qui indique la taille maximale de la liste retournée. La valeur par défaut demax_results
est 100.
- Ignorez l’exécution enfant et l’erreur du journal lorsque l’exécution enfant de la charge a échoué (par exemple, 404) à l’aide de
- azureml-training-tabular
- Prise en charge des fonctionnalités/régresseurs connus au moment de la prévision dans les modèles TCN de prévision AutoML.
2023-06-26
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.52.0
- azureml-automl-dnn-vision
- La signature mlflow pour les modèles automl du runtime (hérité) a changé et accepte désormais les entrées binaires. Cela permet l’inférence par lots. La fonction de prédiction est à compatibilité descendante. Les utilisateurs peuvent ainsi toujours envoyer des chaînes en base64 en tant qu’entrée. La sortie de la fonction de prédiction a été modifiée pour supprimer le nom de fichier temporaire et la clé de visualisations et d’attributions vides lorsque l’explicabilité du modèle est n...
- azureml-contrib-automl-dnn-forecasting
- Correction d’un bogue qui provoquait des défaillances lors de l’entraînement TCN distribué lorsque les données se composent d’une seule série chronologique.
- azureml-interpret
- supprimer le pin shap dans azureml-interpret pour effectuer la mise à jour vers la dernière version dans interpret-community
- azureml-responsibleai
- mise à jour de l’environnement commun et du package azureml-responsibleai vers raiwidgets et responsibleai 0.28.0
2023-05-20
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.51.0
- azureml-automl-core
- La tâche de prévision AutoML prend désormais en charge les prévisions propagées, avec une prise en charge partielle des prévisions quantiles pour les séries chronologiques hiérarchiques (HTS).
- Interdire l’utilisation de jeux de données non tabulaires pour les clients pour des scénarios de classification (multi-classe et étiquette multiple)
- azureml-automl-dnn-nlp
- Interdire l’utilisation de jeux de données non tabulaires pour les clients pour des scénarios de classification (multi-classe et étiquette multiple)
- azureml-contrib-automl-pipeline-steps
- La tâche de prévision AutoML prend désormais en charge les prévisions propagées, avec une prise en charge partielle des prévisions quantiles pour les séries chronologiques hiérarchiques (HTS).
- azureml-fsspec
- Remplace toutes les erreurs causées par l’utilisateur dans MLTable &FSSpec par une exception UserErrorException personnalisée importée à partir d’azureml-dataprep.
- azureml-interpret
- Package azureml-interpret mis à jour vers interpret-community 0.29.*
- azureml-pipeline-core
- Correction de
pipeline_version
qui ne prend pas effet lors de l’appel depipeline_endpoint.submit()
.
- Correction de
- azureml-train-automl-client
- La tâche de prévision AutoML prend désormais en charge les prévisions propagées, avec une prise en charge partielle des prévisions quantiles pour les séries chronologiques hiérarchiques (HTS).
- azureml-train-automl-runtime
- La tâche de prévision AutoML prend désormais en charge les prévisions propagées, avec une prise en charge partielle des prévisions quantiles pour les séries chronologiques hiérarchiques (HTS).
- mltable
- D’avantage de variantes d’encodage telles que
utf-8
sont désormais prises en charge lors du chargement des fichiers MLTable. - Remplace toutes les erreurs causées par l’utilisateur dans MLTable &FSSpec par une exception UserErrorException personnalisée importée à partir d’azureml-dataprep.
- D’avantage de variantes d’encodage telles que
10-04-2023
Kit SDK Azure Machine Learning pour Python v1.50.0
- azureml-contrib-automl-dnn-forecasting
- Ajout de la prise en charge de la prévision à des quantiles donnés pour les modèles TCN.
- azureml-responsibleai
- Mise à jour de l’environnement commun et du package azureml-responsibleai vers raiwidgets et responsibleai 0.26.0
- azureml-train-automl-runtime
- Correction de la gestion MLTable pour le scénario de test de modèle
- azureml-training-tabular
- Ajout de quantiles en tant que paramètre dans la méthode forecast_quantile.
01-03-2023
Annonce de l'arrêt de la prise en charge de Python 3.7 dans les packages du kit de développement logiciel (SDK) Azure Machine Learning v1
- Dépréciation des fonctionnalités
- Dépréciation de Python 3.7 comme runtime pris en charge pour les packages du kit de développement logiciel (SDK) v1
- Le 4 décembre 2023, Azure Machine Learning cessera officiellement de prendre en charge Python 3.7 pour les packages du kit de développement logiciel (SDK) v1 et le dépréciera en tant que runtime pris en charge. Pour plus d’informations, consultez notre page sur la stratégie de prise en charge des versions du kit de développement logiciel (SDK) Azure pour Python
- À compter du 4 décembre 2023 (date de dépréciation), les packages du kit de développement logiciel (SDK) Azure Machine Learning v1 ne va plus recevoir de correctifs de sécurité et d’autres mises à jour pour le runtime Python 3.7.
- Les versions actuelles de Python 3.7 pour le kit de développement logiciel (SDK) Azure Machine Learning v1 fonctionnera toujours. Toutefois, pour continuer à recevoir des mises à jour de sécurité et à rester qualifié pour le support technique, Azure Machine Learning vous recommande vivement de déplacer vos scripts et dépendances vers une version prise en charge du runtime Python.
- Nous vous recommandons d’utiliser Python version 3.8 ou ultérieure comme runtime pour les fichiers du kit de développement logiciel (SDK) Azure Machine Learning v1.
- En outre, les packages du SDK Azure Machine Learning v1 basés sur Python 3.7 ne seront plus qualifiés pour le support technique.
- Utilisez le support Azure Machine Learning pour nous contacter en cas de préoccupation.
- Dépréciation de Python 3.7 comme runtime pris en charge pour les packages du kit de développement logiciel (SDK) v1
13-02-2023
Kit SDK Azure Machine Learning pour Python v1.49.0
- Dernières modifications
- À compter des versions 1.49.0 et ultérieures, les algorithmes AutoML suivants ne sont pas pris en charge.
- Régression : FastLinearRegressor, OnlineGradientDescentRegressor
- Classification : AveragedPerceptronClassifier.
- Utilisez la version 1.48.0 ou une version antérieure pour continuer à utiliser ces algorithmes.
- À compter des versions 1.49.0 et ultérieures, les algorithmes AutoML suivants ne sont pas pris en charge.
- Résolutions de bogue et améliorations
- azureml-automl-dnn-nlp
- Journaux permettant d’afficher les valeurs finales appliquées aux paramètres du modèle et des hyperparamètres, en fonction des valeurs par défaut et des valeurs spécifiées par l’utilisateur.
- azureml-contrib-automl-dnn-forecasting
- Les métriques non scalaires pour TCNForecaster reflètent désormais les valeurs de la dernière époque.
- Les visuels d’horizon de prévision pour le jeu d’apprentissage et le jeu de tests sont désormais disponibles lors de l’exécution de l’expérience d’entraînement TCN.
- Les exécutions n’échouent plus à cause de l’erreur « Échec du calcul des métriques TCN ». Le message d’avertissement indiquant que « Le calcul des métriques de prévision a entraîné une erreur en signalant les pires scores » est toujours journalisé. À la place, nous déclenchons une exception lorsque nous sommes confrontés à une perte de validation inf/nan plus de deux fois consécutivement, avec un message « Modèle non valide, l’entraînement TCN n’a pas convergé ». Les clients doivent savoir que les modèles chargés peuvent retourner des valeurs nan/inf sous forme de prédictions lors de l’inférence après cette modification.
- azureml-core
- La création d’un espace de travail Azure Machine Learning utilise Application Insights basé sur Log Analytics en préparation de la dépréciation de la fonctionnalité Application Insights classique. Les utilisateurs qui souhaitent se servir de ressources Application Insights classiques peuvent toujours spécifier leurs propres ressources à apporter lors de la création d’un espace de travail Azure Machine Learning.
- azureml-interpret
- Package azureml-interpret mis à jour vers interpret-community 0.28.*
- azureml-mlflow
- Mise à jour du client azureml-mlflow avec la prise en charge initiale de MLflow 2.0
- azureml-responsibleai
- Package et notebooks azureml-responsibleai mis à jour vers raiwidgets et responsibleai v0.24.0
- azureml-sdk
- azureml-sdk et azureml-train-automl-client prennent désormais en charge Python version 3.10
- azureml-train-automl-client
- azureml-sdk et azureml-train-automl-client prennent désormais en charge Python version 3.10
- azureml-train-automl-runtime
- Nettoyage les y manquants avant l’entraînement
- Nettoyage des valeurs NaN ou vides de la colonne cible pour les scénarios sans streaming
- Les visuels d’horizon de prévision pour le jeu de tests sont désormais disponibles lors de l’exécution de l’expérience d’entraînement.
- azureml-train-core
- Ajout du support au client pour fournir un ID d’exécution personnalisé pour les exécutions hyperdrive
- azureml-train-restclients-hyperdrive
- Ajout du support au client pour fournir un ID d’exécution personnalisé pour les exécutions hyperdrive
- azureml-automl-dnn-nlp
2022-12-05
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.48.0
Dernières modifications
- La prise en charge de Python 3.6 a été dépréciée pour les packages du SDK Azure Machine Learning.
Résolutions de bogue et améliorations
- azureml-core
- Les comptes de stockage créés dans le cadre de la création de l’espace de travail définissent maintenant l’accès public aux objets blob sur Désactivé par défaut
- azureml-responsibleai
- Mise à jour du package et des notebooks azureml-responsibleai vers raiwidgets et les packages responsibleai v0.23.0
- Ajout du sérialiseur de modèles et du modèle pyfunc au package azureml-responsibleai pour enregistrer et récupérer facilement des modèles
- azureml-train-automl-runtime
- Ajout de la documentation pour les paramètres ManyModels et les paramètres HierarchicalTimeSeries
- Correction d’un bogue dans lequel le code généré n’entraîne/ne teste pas les fractionnements correctement.
- Correction d’un bogue qui entraînait l’échec des travaux d’entraînement de code générés par les prévisions.
- azureml-core
2022-10-25
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.47.0
- azureml-automl-dnn-nlp
- Modifications de runtime pour AutoML NLP afin de prendre en compte les paramètres d’entraînement fixes, dans le cadre du nouveau balayage du modèle et du réglage des hyperparamètres.
- azureml-mlflow
- AZUREML_ARTIFACTS_DEFAULT_TIMEOUT peut être utilisé pour contrôler le délai d’attente pour le chargement de l’artefact
- azureml-train-automl-runtime
- La formation de nombreux modèles et séries chronologiques hiérarchiques applique désormais la vérification des paramètres de délai d’expiration pour détecter les conflits avant de soumettre l’expérience pour exécution. Cela permet d’éviter l’échec de l’expérience pendant l’exécution, en levant l’exception avant d’envoyer l’expérience.
- Les clients peuvent désormais contrôler la taille de l’étape tout en utilisant des prévisions propagées dans les inférences de nombreux modèles.
- L’inférence ManyModels avec des données tabulaires non partitionnées prend désormais en charge forecast_quantiles.
26-09-20022
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.46.0
- azureml-automl-dnn-nlp
- Les clients ne seront plus autorisés à spécifier une ligne dans CoNLL, qui ne comprend qu’un jeton. La ligne doit toujours être une nouvelle ligne vide ou une ligne avec exactement un jeton suivi d’un espace exactement suivi d’une étiquette exactement.
- azureml-contrib-automl-dnn-forecasting
- Il existe un cas de figure dans lequel les échantillons sont réduits à 1 après le fractionnement de validation croisée, mais sample_size pointe toujours vers le nombre avant le fractionnement et, par conséquent, batch_size finit par être supérieur au nombre d’échantillons dans certains cas. Dans ce correctif, nous initialisons sample_size après le fractionnement
- azureml-core
- Ajout de l’avertissement de dépréciation quand les clients d’inférence utilisent les API de modèle de déploiement CLI/SDK v1 pour déployer des modèles ainsi que lorsque la version de Python est la version 3.6 ou inférieure.
- Les valeurs suivantes de
AZUREML_LOG_DEPRECATION_WARNING_ENABLED
modifient le comportement comme suit :- Valeur par défaut : affiche l’avertissement lorsque le client utilise Python 3.6 et moins et pour cli/SDK v1.
True
- affiche l’avertissement de dépréciation du Kit de développement logiciel (SDK) v1 sur les packages azureml-sdk.False
- désactive l’avertissement de dépréciation du Kit de développement logiciel (SDK) v1 sur les packages azureml-sdk.
- Commande à exécuter pour définir la variable d’environnement pour désactiver le message de dépréciation :
- Windows -
setx AZUREML_LOG_DEPRECATION_WARNING_ENABLED "False"
- Linux –
export AZUREML_LOG_DEPRECATION_WARNING_ENABLED="False"
- Windows -
- azureml-interpret
- mise à jour du paquet azureml-interpret vers interpret-community 0.27.*
- azureml-pipeline-core
- Corrigez le fuseau horaire par défaut de planification sur UTC.
- Corrigez la réutilisation incorrecte lors de l’utilisation de SqlDataReference dans l’étape DataTransfer.
- azureml-responsibleai
- mise à jour du package azureml-responsibleai et des images curées vers raiwidgets et responsibleai v0.22.0.
- azureml-train-automl-runtime
- Correction d’un bogue dans les scripts générés qui a provoqué le rendu correct de certaines métriques dans l’interface utilisateur.
- De nombreux modèles prennent désormais en charge les prévisions propagées pour l’inférence.
- Prise en charge du retour des modèles principaux
N
dans de nombreux scénarios de modèles.
29/08/2022
Kit SDK Azure Machine Learning pour Python v1.45.0
- azureml-automl-runtime
- Correction du bogue à cause duquel la colonne sample_weight n’était pas correctement validée.
- Ajout de la méthode publique rolling_forecast() aux wrappers du pipeline de prévision pour tous les modèles de prévision pris en charge. Elle remplace la méthode déconseillée rolling_evaluation().
- Correction d’un problème selon lequel les tâches de régression AutoML pouvaient revenir au fractionnement apprentissage/validation pour l’évaluation du modèle, alors que la validation croisée aurait constitué un choix plus approprié.
- azureml-core
- Ajout d’un nouveau suffixe de configuration cloud, « aml_discovery_endpoint ».
- Mise à jour du package azure-storage vendu de la version 2 vers la version 12.
- azureml-mlflow
- Ajout d’un nouveau suffixe de configuration cloud, « aml_discovery_endpoint ».
- azureml-responsibleai
- Mise à jour du package azureml-responsibleai et des images curées vers raiwidgets et responsibleai 0.21.0.
- azureml-sdk
- Ajout de la compatibilité du package azureml-sdk avec Python 3.9.
2022-08-01
SDK Azure Machine Learning pour Python v1.44.0
- azureml-automl-dnn-nlp
- La précision pondérée et le coefficient de corrélation Matthews (MCC) ne seront plus une métrique affichée sur les métriques calculées pour la classification multilabel NLP.
- azureml-automl-dnn-vision
- Déclencher une erreur utilisateur lorsque le format d’annotation non valide est fourni
- azureml-cli-common
- Mise à jour de la description de l’interface CLI v1
- azureml-contrib-automl-dnn-forecasting
- Correction des problèmes d’« Échec de calcul des métriques TCN », problèmes liés à TCNForecaster lorsque différentes séries chronologiques dans le jeu de données de validation ont des longueurs différentes.
- Ajout de la détection d’ID de série chronologique automatique pour les modèles de prévision DNN comme TCNForecaster.
- Correction d’un bogue avec le modèle TCN de prévision où les données de validation peuvent être endommagées dans certaines circonstances lorsque l’utilisateur a fourni le jeu de validation.
- azureml-core
- Autoriser la définition d’un paramètre timeout_seconds lors du téléchargement d’artefacts à partir d’une exécution
- Ajout du message d’avertissement : Le retrait d’Azure Machine Learning CLI v1 est prévu en septembre 2025. Les utilisateurs sont recommandés pour adopter l’interface CLI v2.
- Correction de la soumission à des exceptions non AmlComputes.
- Ajout de la prise en charge du contexte Docker pour les environnements
- azureml-interpret
- Augmenter la version numpy pour les packages AutoML
- azureml-pipeline-core
- Corrigez regenerate_outputs=True ne prenant pas effet lors de l’envoi du pipeline.
- azureml-train-automl-runtime
- Augmenter la version numpy pour les packages AutoML
- Activer la génération de code pour la vision et le nlp
- Colonnes d’origine sur lesquelles les grains sont créés sont ajoutés dans le cadre de predictions.csv
2022-07-21
Annonce de la fin de la prise en charge de Python 3.6 dans les packages du SDK Azure Machine Learning v1
- Dépréciation des fonctionnalités
- Déprécier Python 3.6 en tant que runtime pris en charge pour les packages SDK v1
- Le 05 décembre 2022, Azure Machine Learning a déprécié Python 3.6 en tant que runtime pris en charge, mettant officiellement fin à notre prise en charge de Python 3.6 pour les packages du SDK v1.
- À compter de la date de dépréciation du 05 décembre 2022, Azure Machine Learning n’applique plus de correctifs de sécurité et autres mises à jour au runtime Python 3.6 utilisé par les packages du SDK Azure Machine Learning v1.
- Les packages du SDK Azure Machine Learning v1 existants avec Python 3.6 peuvent toujours s’exécuter. Toutefois, Azure Machine Learning vous recommande vivement de migrer vos scripts et dépendances vers une version de runtime Python prise en charge afin de continuer à recevoir des correctifs de sécurité et à rester éligible au support technique.
- Nous vous recommandons d’utiliser la version Python 3.8 comme runtime pour les packages du SDK Azure Machine Learning v1.
- En outre, les packages du SDK Azure Machine Learning v1 utilisant Python 3.6 ne sont plus éligibles au support technique.
- Pour toute autre question, contactez-nous par le biais du service AML.
- Déprécier Python 3.6 en tant que runtime pris en charge pour les packages SDK v1
27/06/2022
- azureml-automl-dnn-nlp
- Suppression de la colonne d’étiquettes en double des prédictions multi-étiquettes
- azureml-contrib-automl-pipeline-steps
- Many Models offre désormais la possibilité de générer une prédiction au format csv. – La prédiction de nombreux modèles inclut désormais les noms des colonnes dans le fichier de sortie au format csv.
- azureml-core
- L’authentification ADAL est désormais déconseillée et toutes les classes d’authentification utilisent maintenant l’authentification MSAL. Installez azure-cli>=2.30.0 pour avoir recours à l’authentification basée sur MSAL lorsque vous utilisez la classe AzureCliAuthentication.
- Ajout d’un correctif permettant de forcer l’inscription de l’environnement lorsque
Environment.build(workspace)
. Le correctif résout la confusion entre le dernier environnement créé et celui demandé lorsque l’environnement est cloné ou hérité d’une autre instance. - Message d’avertissement du kit de développement logiciel (SDK) invitant à redémarrer l’instance de calcul avant le 31 mai 2022, si elle a été créée avant le 19 septembre 2021
- azureml-interpret
- Mise à jour du package azureml-interpret vers interpret-community 0.26.*
- Dans le package azureml-interpret, ajout de la possibilité d’obtenir auprès de l’explicatif de scoring des noms de fonctionnalités brutes et développées. En outre, ajout d’un exemple au notebook de scoring pour obtenir des noms de fonctionnalités auprès de l’explicatif de scoring, et ajout de la documentation relative aux noms de fonctionnalités brutes et développées.
- azureml-mlflow
- Suppression d’azureml-core en tant que dépendance d’azureml-mlflow. - Les projets MLflow et les déploiements locaux nécessitent azureml-core et doivent être installés séparément.
- Ajout de la prise en charge de la création de points de terminaison et de leur déploiement via le plug-in client MLflow.
- azureml-responsibleai
- Mise à jour du package azureml-responsibleai et des images d’environnement vers la dernière version de responsibleai et raiwidgets (version 0.19.0)
- azureml-train-automl-client
- OutputDatasetConfig est désormais pris en charge en tant qu’entrée du générateur de pipelines MM/HTS. Les mappages sont les suivants : 1) OutputTabularDatasetConfig ->traité comme un jeu de données tabulaires non partitionné. 2) OutputFileDatasetConfig -> traité comme jeu de données classé.
- azureml-train-automl-runtime
- Ajout d’une validation des données qui exige que le nombre d’échantillons de classes minoritaires dans le jeu de données soit au moins égal au nombre de plis de validation croisée demandés.
- La configuration automatique des paramètres de validation croisée est désormais disponible pour les tâches de prévision automatique. Les utilisateurs peuvent désormais spécifier « auto » pour n_cross_validations et cv_step_size, ou les laisser vides. automl fournira ces configurations d’après vos données. Toutefois, cette fonctionnalité n’est actuellement pas prise en charge lorsque TCN est activé.
- Les paramètres de prévision de Many Models et Hierarchical Time Series peuvent désormais être transmis via un objet plutôt qu’à l’aide de paramètres individuels du dictionnaire.
- Activation des points de terminaison des modèles de prévision avec prise en charge des quantiles pour une consommation dans PowerBI.
- Mise à jour de la limite supérieure de la dépendance automl scipy de la version 1.5.2 vers la version 1.5.3
2022-04-25
SDK Azure Machine Learning pour Python v1.41.0
Avertissement de changement cassant
Ce changement cassant provient de la version de juin de azureml-inference-server-http
. Dans la version de juin (v0.9.0) de azureml-inference-server-http
, la prise en charge de Python 3.6 est supprimée. Étant donné que azureml-defaults
dépend de azureml-inference-server-http
, ce changement est propagé à azureml-defaults
. Si vous n’utilisez pas azureml-defaults
pour l’inférence, n’hésitez pas à utiliser azureml-core
ou tout autre package du SDK Azure Machine Learning directement, au lieu d’installer azureml-defaults
.
- azureml-automl-dnn-nlp
- Activation de la fonctionnalité de texte à longue portée par défaut.
- azureml-automl-dnn-vision
- Changement du type de classe ObjectAnnotation, il passe d’objet à « objet de données ».
- azureml-core
- Cette version met à jour la classe Keyvault utilisée par les clients pour leur permettre de fournir le type de contenu keyvault lors de la création d’un secret à l’aide du SDK. Cette version met également à jour le SDK pour inclure une nouvelle fonction qui permet aux clients de récupérer la valeur du type de contenu à partir d’un secret spécifique.
- azureml-interpret
- Mise à jour du package azureml-interpret en interpret-community 0.25.0
- azureml-pipeline-core
- N’imprimez plus les détails de l’exécution si
pipeline_run.wait_for_completion
ashow_output=False
- N’imprimez plus les détails de l’exécution si
- azureml-train-automl-runtime
- Corrige un bogue qui entraîne l’échec de la génération du code lorsque le package azureml-contrib-automl-dnn-forecasting est présent dans l’environnement d’entraînement.
- Correction de l’erreur qui se produisait lors de l’utilisation d’un jeu de données de test sans colonne d’étiquette avec le test des modèles AutoML.
28-03-2022
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.40.0
- azureml-automl-dnn-nlp
- Nous rendons la fonctionnalité de texte de plage longue facultative et seulement si les clients la choisissent explicitement, à l’aide du kwarg « enable_long_range_text »
- Ajout de la couche de validation des données pour le scénario de classification multiclasse, qui applique la même classe de base que multi-étiquette pour les validations courantes, et une classe dérivée pour plus de contrôles de validation des données propres à la tâche.
- azureml-automl-dnn-vision
- Correction de KeyError lors du calcul des poids des classes.
- azureml-contrib-reinforcementlearning
- Message d’avertissement du kit SDK concernant la dépréciation prochaine du service RL
- azureml-core
-
- Retour des journaux pour les exécutions qui sont passées par notre nouveau runtime lors de l’appel de l’une des fonctions d’obtention des journaux sur l’objet d’exécution, notamment
run.get_details
,run.get_all_logs
, etc.
- Retour des journaux pour les exécutions qui sont passées par notre nouveau runtime lors de l’appel de l’une des fonctions d’obtention des journaux sur l’objet d’exécution, notamment
- Ajout de la méthode expérimentale Datastore.register_onpremises_hdfs pour permettre aux utilisateurs de créer des magasins de données pointant vers des ressources HDFS locales.
- Mise à jour de la documentation de l’interface CLI dans la commande help
-
- azureml-interpret
- Pour le package azureml-interpret, supprimez le PIN Shap avec la mise à jour de packaging. Supprimez numba et numpy pin après la mise à jour de l’environnement CE.
- azureml-mlflow
- Correction de bogue pour l’échec de run_local du client de déploiement MLflow lorsque l’objet de configuration n’était pas fourni.
- azureml-pipeline-steps
- Suppression du lien rompu du pipeline déprécié EstimatorStep
- azureml-responsibleai
- Publication du package update azureml-responsibleai sur raiwidgets et responsibleai 0.17.0
- azureml-train-automl-runtime
- La génération de code pour le ML automatisé prend désormais en charge les modèles ForecastTCN (expérimental).
- Les modèles créés via la génération de code ont désormais toutes les métriques calculées par défaut (à l’exception de l’erreur absolue moyenne normalisée, de l’erreur absolue médiane normalisée, de l’erreur RMSE normalisée et de l’erreur RMSLE normalisée dans le cas de modèles de prévision). Vous pouvez modifier la liste des métriques à calculer en modifiant la valeur de retour de
get_metrics_names()
. La validation croisée est désormais utilisée par défaut pour les modèles de prévision créés via la génération de code.
- azureml-training-tabular
- Vous pouvez modifier la liste des métriques à calculer en modifiant la valeur de retour de
get_metrics_names()
. La validation croisée est désormais utilisée par défaut pour les modèles de prévision créés via la génération de code. - Conversion du type décimal y-test en float pour permettre au calcul des métriques de se poursuivre sans erreur.
- Vous pouvez modifier la liste des métriques à calculer en modifiant la valeur de retour de
2022-02-28
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.39.0
- azureml-automl-core
- Corriger la forme incorrecte affichée dans PBI pour l’intégration avec les modèles de régression AutoML
- Ajout de la vérification de min-label-classes pour les deux tâches de classification (multi-classe et multi-étiquette). Elle génère une erreur pour l’exécution du client si le nombre unique de classes dans le jeu de données d’entraînement d’entrée est inférieur à 2. Il est inutile d’exécuter la classification sur moins de deux classes.
- azureml-automl-runtime
- Conversion du type décimal y-test en float pour permettre au calcul des métriques de se poursuivre sans erreur.
- La formation AutoML prend désormais en charge numpy version 1.8
- azureml-contrib-automl-dnn-forecasting
- Correction d’un bogue dans le modèle TCNForecaster où toutes les données d’apprentissage n’étaient pas utilisées lorsque des paramètres de validation croisée étaient fournis.
- La méthode de prévision du wrapper TCNForecaster endommageait les prédictions de temps d’inférence. Correction d’un problème où la méthode de prévision n’utilisait pas les données de contexte les plus récentes dans les scénarios de formation valide.
- azureml-interpret
- Pour le package azureml-interpret, supprimez le PIN Shap avec la mise à jour de packaging. Supprimez numba et numpy pin après la mise à jour de l’environnement CE.
- azureml-responsibleai
- Publication du package azureml-responsibleai package sur raiwidgets et responsibleai 0.17.0
- azureml-synapse
- Résolvez le problème indiquant que le widget magique a disparu.
- azureml-train-automl-runtime
- Mise à jour des dépendances AutoML pour prendre en charge Python 3.8. Cette modification rompt la compatibilité avec les modèles entraînés avec le kit SDK 1.37 ou une version antérieure, en raison de l’enregistrement d’interfaces Pandas plus récentes dans le modèle.
- La formation AutoML prend désormais en charge numpy version 1.19
- Correction de la logique d’index AutoML reset pour les modèles d’ensemble dans l’API automl_setup_model_explanations
- Dans AutoML, utilisez le modèle de substitution lightgbm au lieu du modèle de substitution linéaire pour les cas épars après la mise à jour vers la dernière version de lightgbm
- Tous les artefacts intermédiaires internes qui sont produits par AutoML sont désormais stockés de manière transparente sur l’exécution parente (au lieu d’être envoyés au magasin d’objets blob de l’espace de travail par défaut). Les utilisateurs devraient être en mesure de voir les artefacts générés par AutoML sous le répertoire
outputs/
sur l’exécution parente.
24-01-2022
SDK Azure Machine Learning pour Python v1.38.0
- azureml-automl-core
- Prise en charge de Tabnet Regressor et Tabnet Classifier dans AutoML
- Enregistrement du transformateur de données dans des sorties d’exécution parentes, qui peuvent être réutilisées pour produire le même jeu de données caractérisé, qui a été utilisé pendant l’exécution de l’expérience
- Prise en charge de l’obtention de métriques principales pour la tâche de prévision dans l’API get_primary_metrics.
- Renommage du deuxième paramètre facultatif dans les scripts de scoring v2 en GlobalParameters
- azureml-automl-dnn-vision
- Ajout de métriques de scoring dans l’interface utilisateur des métriques
- azureml-automl-runtime
- Correction du bogue pour les cas où le nom de l’algorithme pour les modèles NimbusML pouvait apparaître comme des chaînes vides, soit dans le studio ML, soit dans les sorties de la console.
- azureml-core
- Ajout du paramètre blobfuse_enabled dans azureml.core.webservice.aks.AksWebservice.deploy_configuration. Lorsque ce paramètre a la valeur true, les modèles et les fichiers de scoring sont téléchargés avec blobfuse au lieu de l’API de Stockage Blob.
- azureml-interpret
- Mise à jour d’azureml-interpret vers interpret-community 0.24.0
- Mise à jour d’azureml-interpret dans l’explication de scoring pour prendre en charge la dernière version de lightgbm avec sparse TreeExplainer
- Mise à jour d’azureml-interpret vers interpret-community 0.23.*
- azureml-pipeline-core
- Ajout d’une note dans pipelinedata, recommander à l’utilisateur de se servir du jeu de données de sortie de pipeline à la place.
- azureml-pipeline-steps
- Ajout de
environment_variables
à ParallelRunConfig, les variables d’environnement d’exécution peuvent être passées par ce paramètre et seront définies là où le script utilisateur est exécuté.
- Ajout de
- azureml-train-automl-client
- Prise en charge de Tabnet Regressor et Tabnet Classifier dans AutoML
- azureml-train-automl-runtime
- Enregistrement du transformateur de données dans des sorties d’exécution parentes, qui peuvent être réutilisées pour produire le même jeu de données caractérisé, qui a été utilisé pendant l’exécution de l’expérience
- azureml-train-core
- Activation de la prise en charge de la fin précoce de l’optimisation bayésienne dans Hyperdrive
- Les objets Bayesian et GridParameterSampling peuvent maintenant passer sur les propriétés
13-12-2021
SDK Azure Machine Learning pour Python v1.37.0
Dernières modifications
- azureml-core
- À partir de la version 1.37.0, le SDK Azure Machine Learning utilise MSAL comme bibliothèque d’authentification sous-jacente. MSAL utilise le flux d’authentification Azure Active Directory (Azure AD) v2.0 pour fournir plus de fonctionnalités et augmenter la sécurité du cache de jeton. Pour plus d’informations, consultez Présentation de la bibliothèque d’authentification Microsoft (MSAL).
- Mettez à jour les dépendances du SDK AML vers la dernière version de la bibliothèque cliente Azure Resource Management pour Python (azure-mgmt-resource>=15.0.0.0,20.0.0<) et adoptez le Kit de développement logiciel (SDK) track2.
- À partir de la version 1.37.0, l’extension azure-ml-cli doit être compatible avec la dernière version d’Azure CLI>=2.30.0.
- Quand vous utilisez Azure CLI dans un pipeline, comme Azure DevOps, vérifiez que toutes les tâches/étapes utilisent des versions d’Azure CLI supérieures à v2.30.0 pour Azure CLI basé sur MSAL. Azure CLI 2.30.0 n’offre pas une compatibilité descendante avec les versions antérieures et génère une erreur lors de l’utilisation de versions incompatibles. Pour utiliser les informations d’identification Azure CLI avec le SDK Azure Machine Learning, Azure CLI doit être installé sous forme de package pip.
- azureml-core
Résolutions de bogue et améliorations
- azureml-core
- Types d’instances supprimés du workflow d’attachement pour le calcul Kubernetes. Les types d’instances peuvent maintenant être configurés directement dans le cluster Kubernetes. Pour plus d’informations, visitez aka.ms/amlarc/doc.
- azureml-interpret
- Mise à jour d’azureml-interpret en interpret-community 0.22.*
- azureml-pipeline-steps
- Correction d’un bogue où l’espace réservé de l’expérience pouvait être créé lors de l’envoi d’un pipeline avec un AutoMLStep.
- azureml-responsibleai
- Mise à jour de azureml-responsibleai et de l’environnement d’instance de calcul vers la version 0.15.0 de responsibleai et de raiwidgets.
- Mise à jour du package azureml-responsibleai vers la dernière version de responsibleai (0.14.0).
- azureml-tensorboard
- Vous pouvez maintenant utiliser
Tensorboard(runs, use_display_name=True)
pour monter les journaux TensorBoard dans des dossiers nommés avecrun.display_name/run.id
au lieu derun.id
.
- Vous pouvez maintenant utiliser
- azureml-train-automl-client
- Correction d’un bogue où l’espace réservé de l’expérience pouvait être créé lors de l’envoi d’un pipeline avec un AutoMLStep.
- Mise à jour de la documentation AutoMLConfig sur test_data et test_size pour refléter l’état de préversion.
- azureml-train-automl-runtime
- Ajout d’une nouvelle fonctionnalité permettant aux utilisateurs de passer des grains de série chronologique avec une valeur unique.
- Dans certains scénarios, un modèle AutoML peut prédire des valeurs NaN. Les lignes qui correspondent à ces prédictions NaN sont supprimées des jeux de données de test et des prédictions avant le calcul des métriques dans les séries de tests.
- azureml-core
2021-11-08
Kit SDK Azure Machine Learning pour Python v1.36.0
- Résolutions de bogue et améliorations
- azureml-automl-dnn-vision
- Correction de fautes de frappe mineures dans certains messages d’erreur.
- azureml-contrib-reinforcementlearning
- L’envoi d’exécutions d’entraînement par renforcement qui utilisent des simulateurs n’est plus pris en charge.
- azureml-core
- Ajout de la prise en charge du blob Premium partitionné.
- La spécification de clouds non publics pour l’authentification de l’identité managée n’est plus prise en charge.
- L’utilisateur peut faire migrer le service web AKS vers un déploiement et point de terminaison en ligne, ce qui est géré par l’interface CLI (v2).
- Le type d’instance pour les tâches d’apprentissage sur les cibles de calcul Kubernetes peut désormais être défini via une propriété RunConfiguration : run_config. kubernetescompute.instance_type.
- azureml-defaults
- Suppression des dépendances redondantes telles que gunicorn et werkzeug
- azureml-interpret
- Mise à jour du package azureml-interpret vers la version 0.21.* du package interpret-community
- azureml-pipeline-steps
- Dépréciation de MpiStep en faveur de l’utilisation de CommandStep pour l’exécution de la formation ML (y compris la formation distribuée) dans les pipelines.
- azureml-train-automl-rutime
- Mise à jour des documents de format de sortie des prédictions de test du modèle AutoML.
- Ajout de descriptions docstring pour le modèle de prévision Naive, SeasonalNaive, Average et SeasonalAverage.
- Le résumé de caractérisation est maintenant stocké en tant qu’artefact sur l’exécution (recherchez un fichier nommé featurization_summary.json dans le dossier outputs)
- Activation de la prise en charge des indicateurs de catégorie pour Tabnet Learner.
- Ajout du paramètre downsample à automl_setup_model_explanations pour permettre aux utilisateurs d’obtenir des explications sur toutes les données sans sous-échantillonnage en affectant à ce paramètre la valeur false.
- azureml-automl-dnn-vision
11/10/2021
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.35.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Activation du calcul des métriques binaires
- azureml-contrib-fairness
- Amélioration du message d’erreur en cas d’échec du téléchargement d’un tableau de bord
- azureml-core
- Le bogue dans la spécification de clouds non publics pour l’authentification de l’identité managée a été corrigé.
- Les indicateurs expérimentaux Dataset.File.upload_directory() et Dataset.Tabular.register_pandas_dataframe() sont désormais supprimés.
- Les indicateurs expérimentaux sont désormais supprimés dans la méthode partition_by() de la classe TabularDataset.
- azureml-pipeline-steps
- Les indicateurs expérimentaux sont maintenant supprimés pour le paramètre
partition_keys
de la classe ParallelRunConfig.
- Les indicateurs expérimentaux sont maintenant supprimés pour le paramètre
- azureml-interpret
- Mise à jour du package azureml-interpret vers intepret-community 0.20.*
- azureml-mlflow
- Possibilité d’enregistrer les artefacts et les images avec MLflow en utilisant des sous-répertoires.
- azureml-responsibleai
- Amélioration du message d’erreur en cas d’échec du téléchargement d’un tableau de bord
- azureml-train-automl-client
- Ajout de la prise en charge des tâches de vision par ordinateur, telles que la classification d’images, la détection d’objet et la segmentation d’instance. Vous trouverez une documentation détaillée à l’adresse : Configurer AutoML pour entraîner des modèles de vision par ordinateur avec Python (v1).
- Activation du calcul des métriques binaires
- azureml-train-automl-runtime
- Ajout de la prise en charge de TCNForecaster aux séries de tests de modèle.
- Mise à jour du format de sortie de test predictions.csv du modèle. Les colonnes de sortie incluent maintenant les valeurs cibles d’origine et les fonctionnalités, qui ont été transmises à la série de tests. Ceci peut être désactivé en définissant
test_include_predictions_only=True
dansAutoMLConfig
ou en définissantinclude_predictions_only=True
dansModelProxy.test()
. Si l’utilisateur a demandé d’inclure uniquement des prédictions, le format de sortie ressemble alors à ceci (la prévision est identique à la régression) : Classification => [valeurs prédites] [probabilités] Régression => [valeurs prédites] ; sinon (valeur par défaut) : Classification => [étiquettes de données de test d’origine] [valeurs prédites] [probabilités] [caractéristiques] Régression => [étiquettes de données de test d’origine] [valeurs prédites] [caractéristiques]. Le nom de colonne[predicted values]
=[label column name] + "_predicted"
. Les noms de colonne[probabilities]
=[class name] + "_predicted_proba"
. Si aucune colonne cible n’a été transmise en tant qu’entrée à la série de tests,[original test data labels]
ne figurera pas dans la sortie.
- azureml-automl-core
07/09/2021
Azure Machine Learning SDK pour Python v1.34.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Prise en charge supplémentaire pour le réajustement d’un pipeline de prévision précédemment entraîné.
- Capacité supplémentaire d’obtention des prédictions sur les données d’apprentissage (prédiction en échantillon) pour les prévisions.
- azureml-automl-runtime
- Ajoutez la prise en charge pour retourner les probabilités prédites à partir d’un point de terminaison déployé d’un modèle de classifieur AutoML.
- Option de prévision supplémentaire permettant aux utilisateurs de spécifier que toutes les prédictions doivent être des entiers.
- Suppression du nom de la colonne cible d’une partie du modèle explication des noms de fonctionnalités pour les expériences locales avec training_data_label_column_name
- en tant qu’entrées de jeu de données.
- Prise en charge supplémentaire pour le réajustement d’un pipeline de prévision précédemment entraîné.
- Capacité supplémentaire d’obtention des prédictions sur les données d’apprentissage (prédiction en échantillon) pour les prévisions.
- azureml-core
- Prise en charge supplémentaire pour définir le type de colonne de flux, monter et télécharger des colonnes de flux dans un jeu de données tabulaire.
- Nouveaux champs facultatifs ajoutés à Kubernetes.attach_configuration (identity_type = None, identity_ids = None) qui autorisent l’attachement de KubernetesCompute avec l’identité SystemAssigned ou UserAssigned. Les nouveaux champs d’identité sont inclus lors de l’appel de print(compute_target) ou de compute_target.serialize(): identity_type, identity_id, principal_id et tenant_id/client_id.
- azureml-dataprep
- Prise en charge supplémentaire pour définir le type de colonne de flux pour le jeu de données tabulaire. prise en charge supplémentaire pour monter et télécharger des colonnes de flux dans un jeu de données tabulaire.
- azureml-defaults
- La dépendance
azureml-inference-server-http==0.3.1
a été ajoutée àazureml-defaults
.
- La dépendance
- azureml-mlflow
- Autorisez la pagination de l’API list_experiments en ajoutant
max_results
et des paramètres facultatifspage_token
. Pour obtenir de la documentation, consultez les documents officiels MLflow.
- Autorisez la pagination de l’API list_experiments en ajoutant
- azureml-sdk
- Remplacement de la dépendance sur le package déconseillé (azureml-train) dans azureml-sdk.
- Ajouter azureml-responsibleai aux extras azureml-sdk
- azureml-train-automl-client
- Exposez les paramètres
test_data
ettest_size
dansAutoMLConfig
. Ces paramètres peuvent être utilisés pour démarrer automatiquement une série de tests après la fin de la phase de formation du modèle. La série de tests calcule les prédictions à l’aide du meilleur modèle et génère des métriques en fonction de ces prédictions.
- Exposez les paramètres
- azureml-automl-core
2021-08-24
Azure Machine Learning - Expérimentation - Interface utilisateur
- Exécuter la suppression
- Exécuter la suppression est une nouvelle fonctionnalité qui permet aux utilisateurs de supprimer une ou plusieurs exécutions de leur espace de travail.
- Cette fonctionnalité peut aider les utilisateurs à réduire les coûts de stockage et à gérer la capacité de stockage en supprimant régulièrement les exécutions et les expériences directement à partir de l’interface utilisateur.
- Annuler l’exécution du lot
- L’option d’annulation par lot est une nouvelle fonctionnalité qui permet aux utilisateurs de sélectionner une ou plusieurs exécutions à annuler dans leur liste d’exécution.
- Cette fonctionnalité permet aux utilisateurs d’annuler plusieurs exécutions en file d’attente et de libérer de l’espace sur leur cluster.
18-08-2021
Azure Machine Learning - Expérimentation - Interface utilisateur
- Nom d’affichage de l’exécution
- « Nom d’affichage de l’exécution » est un nouveau nom d’affichage modifiable et facultatif qui peut être assigné à une exécution.
- Ce nom peut faciliter le suivi, l’organisation et la découverte des exécutions.
- Le nom d’affichage de l’exécution est défini par défaut sur un format adjectif_nom_guid (exemple : awesome_watch_2i3uns).
- Ce nom par défaut peut être modifié en un nom plus personnalisable. Vous pouvez le modifier à partir de la page Détails de l’exécution dans l’interface utilisateur du studio Azure Machine Learning.
02-08-2021
SDK Azure Machine Learning pour Python v1.33.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Amélioration de la gestion des erreurs liées à la récupération du modèle XGBoost.
- Ajout de la possibilité de convertir les prédictions de nombres à virgule flottante en nombres entiers pour les tâches de prévision et de régression.
- Mise à jour de la valeur par défaut pour enable_early_stopping dans AutoMLConfig sur True.
- azureml-automl-runtime
- Ajout de la possibilité de convertir les prédictions de nombres à virgule flottante en nombres entiers pour les tâches de prévision et de régression.
- Mise à jour de la valeur par défaut pour enable_early_stopping dans AutoMLConfig sur True.
- azureml-contrib-automl-pipeline-steps
- La série chronologique est activée pour les tâches de prévision via des pipelines.
- Ajout de la prise en charge des jeux de données tabulaires pour l’inférence
- Un chemin personnalisé peut être spécifié pour les données d’inférence
- azureml-contrib-reinforcementlearning
- Certaines propriétés dans
azureml.core.environment.DockerSection
sont dépréciées, telles que la propriétéshm_size
utilisée par les Workers Ray dans les travaux d’apprentissage par renforcement. Cette propriété peut désormais être spécifiée dansazureml.contrib.train.rl.WorkerConfiguration
à la place.
- Certaines propriétés dans
- azureml-core
- Correction d’un lien hypertexte dans la documentation
ScriptRunConfig.distributed_job_config
- Les clusters de calcul Azure Machine Learning peuvent désormais être créés à un emplacement différent de celui de l’espace de travail. C’est utile pour optimiser l’allocation de la capacité inactive et gérer l’utilisation du quota à différents emplacements sans avoir à créer plus d’espaces de travail juste pour utiliser le quota et créer un cluster de calcul à un emplacement particulier. Pour plus d’informations, consultez Créer un cluster de calcul Azure Machine Learning.
- Ajout de display_name comme champ de nom mutable de l’objet Run.
- Le jeu de données from_files prend désormais en charge l’omission des extensions de données pour les données d’entrée volumineuses
- Correction d’un lien hypertexte dans la documentation
- azureml-dataprep
- Correction d’un bogue qui entraînait l’échec de to_dask_dataframe en raison d’une condition de concurrence.
- Le jeu de données from_files prend désormais en charge l’omission des extensions de données pour les données d’entrée volumineuses
- azureml-defaults
- Nous supprimons la dépendance azureml-model-management-sdk==1.0.1b6.post1 d’azureml-defaults.
- azureml-interpret
- Mise à jour d’azureml-interpret en interpret-community 0.19.*
- azureml-pipeline-core
- La série chronologique est activée pour les tâches de prévision via des pipelines.
- azureml-train-automl-client
- Basculement vers l’utilisation du magasin d’objets blob pour la mise en cache dans le ML automatisé.
- La série chronologique est activée pour les tâches de prévision via des pipelines.
- Amélioration de la gestion des erreurs liées à la récupération du modèle XGBoost.
- Mise à jour de la valeur par défaut pour enable_early_stopping dans AutoMLConfig sur True.
- azureml-train-automl-runtime
- Basculement vers l’utilisation du magasin d’objets blob pour la mise en cache dans le ML automatisé.
- La série chronologique est activée pour les tâches de prévision via des pipelines.
- Mise à jour de la valeur par défaut pour enable_early_stopping dans AutoMLConfig sur True.
- azureml-automl-core
06-07-2021
SDK Azure Machine Learning pour Python v1.32.0
- Résolutions de bogue et améliorations
- azureml-core
- Exposer et diagnostiquer l’intégrité de l’espace de travail dans le SDK/l’interface CLI
- azureml-defaults
- Ajout de la dépendance
opencensus-ext-azure==1.0.8
à azureml-defaults
- Ajout de la dépendance
- azureml-pipeline-core
- Mise à jour d’AutoMLStep pour utiliser des images prégénérées quand l’environnement pour la soumission des travaux correspond à l’environnement par défaut
- azureml-responsibleai
- Ajout d’un nouveau client d’analyse des erreurs pour charger, télécharger et lister les rapports d’analyse des erreurs
- Vérification de la synchronisation des versions des packages
raiwidgets
etresponsibleai
- azureml-train-automl-runtime
- Définition du temps alloué pour effectuer une recherche dynamique entre les différentes stratégies de caractérisation sur au maximum un quart du délai d’expiration de l’expérience globale
- azureml-core
21-06-2021
SDK Azure Machine Learning pour Python v1.31.0
- Résolutions de bogue et améliorations
- azureml-core
- Amélioration de la documentation de la propriété platform sur la classe Environment
- Modification de la durée de scale-down des nœuds de calcul AML par défaut de 120 secondes en 1 800 secondes
- Mise à jour du lien de résolution des problèmes par défaut affiché sur le portail pour la résolution des échecs d’exécution : https://aka.ms/azureml-run-troubleshooting
- azureml-automl-runtime
- Nettoyage des données : les échantillons ayant des valeurs cibles dans [None, "", "nan", np.nan] sont supprimés avant la caractérisation et/ou l’entraînement du modèle
- azureml-interpret
- Allongement du délai pour empêcher l’erreur de vidage de la file d’attente des tâches sur les exécutions Azure Machine Learning distantes qui utilisent ExplanationClient
- azureml-pipeline-core
- Ajout du paramètre jar à l’étape synapse
- azureml-train-automl-runtime
- Correction des garde-fous de cardinalité élevée pour les aligner davantage sur la documentation
- azureml-core
2021-06-07
SDK Azure Machine Learning pour Python v1.30.0
- Résolutions de bogue et améliorations
- azureml-core
- Dépendance
ruamel-yaml
épinglée à < 0.17.5 : changement cassant publié dans 0.17.5. - La propriété
aml_k8s_config
est remplacée par les paramètresnamespace
,default_instance_type
etinstance_types
pour l'attachementKubernetesCompute
. - Les clés de synchronisation de l’espace de travail ont été remplacées par une opération durable.
- Dépendance
- azureml-automl-runtime
- Résolution des problèmes où les exécutions avec Big Data peuvent échouer avec
Elements of y_test cannot be NaN
.
- Résolution des problèmes où les exécutions avec Big Data peuvent échouer avec
- azureml-mlflow
- Résolution d’un bogue ave le plugin de déploiement MLFlow pour les modèles sans signature.
- azureml-pipeline-steps
- ParallelRunConfig : document de mise à jour pour process_count_per_node.
- azureml-train-automl-runtime
- Prise en charge des quantiles définis personnalisés pendant l’inférence MM
- Prise en charge de forecast_quantiles pendant l’inférence de traitement par lots.
- azureml-contrib-automl-pipeline-steps
- Prise en charge des quantiles définis personnalisés pendant l’inférence MM
- Prise en charge de forecast_quantiles pendant l’inférence de traitement par lots.
- azureml-core
2021-05-25
Annonce de l’interface CLI (v2) pour Azure Machine Learning
L’extension ml
d’Azure CLI est l’interface de nouvelle génération d’Azure Machine Learning. Elle permet d’entraîner et de déployer des modèles à partir de la ligne de commande, avec des fonctionnalités qui accélèrent le scale-up et le scale-out pour la science des données tout en assurant le suivi du cycle de vie des modèles. Installez et configurez l’interface CLI (v2).
SDK Azure Machine Learning pour Python v1.29.0
- Résolutions de bogue et améliorations
- Dernières modifications
- Prise en charge de Python 3.5. abandonnée.
- azureml-automl-runtime
- Correction d’un bogue faisant échouer le STLFeaturizer si la longueur de la série chronologique est inférieure à la saisonnalité. Cette erreur se manifestait comme IndexError. Cette situation est maintenant gérée sans erreur. Cependant, la composante saisonnière du STL est alors simplement constituée de zéros.
- azureml-contrib-automl-dnn-vision
- Ajout d’une méthode pour l’inférence par lot avec des chemins de fichier.
- azureml-contrib-gbdt
- Le package azureml-contrib-gbdt est déprécié. Il ne recevra peut-être pas les mises à jour ultérieures et sera supprimé complètement de la distribution.
- azureml-core
- Correction de l’explication du paramètre create_if_not_exists dans Datastore.register_azure_blob_container.
- Ajout d’un exemple de code à la classe DatasetConsumptionConfig.
- Ajout de la prise en charge de l’étape comme axe alternatif pour les valeurs de métrique dans run.log()
- azureml-dataprep
- Limitation de la taille de partition acceptée dans
_with_partition_size()
à 2 Go
- Limitation de la taille de partition acceptée dans
- azureml-interpret
- Mise à jour d’azureml-interpret avec la version la plus récente du package interpret-core
- Arrêt de la prise en charge de SHAP DenseData, qui a été déprécié dans SHAP 0.36.0.
- Possibilité de charger
ExplanationClient
vers un magasin de données spécifié par l’utilisateur.
- azureml-mlflow
- Déplacement d’azureml-mlflow vers mlflow-skinny pour réduire l’ampleur des dépendances tout en conservant la prise en charge complète du plug-in
- azureml-pipeline-core
- Mise à jour de l’exemple de code PipelineParameter dans le document de référence pour utiliser le paramètre correct.
- Dernières modifications
2021-05-10
SDK Azure Machine Learning pour Python v1.28.0
- Résolutions de bogue et améliorations
- azureml-automl-runtime
- Amélioration du script de scoring AutoML pour le rendre cohérent avec le concepteur
- Correction du bogue suivant : la prévision avec le modèle Prophet générait une erreur de « colonne manquante » quand l’entraînement était effectué sur une version antérieure du SDK.
- Ajout du modèle ARIMAX aux listes de modèles public-facing et forecasting-supported du SDK AutoML. Ici, ARIMAX est une régression avec des erreurs ARIMA et un cas particulier des modèles de fonction de transfert développés par Box et Jenkins. Pour plus d’informations sur les différences entre les deux approches, consultez The ARIMAX model muddle (Confusion liée au modèle ARIMAX). Contrairement aux autres modèles multivariés qui utilisent des fonctionnalités générées automatiquement, dépendantes des heures/dates (heure de la journée, jour de l’année, etc.), dans AutoML, ce modèle utilise uniquement des fonctionnalités fournies par l’utilisateur et simplifie l’interprétation des coefficients.
- azureml-contrib-dataset
- Description de la documentation mise à jour indiquant que libfuse doit être installé lors de l’utilisation du montage.
- azureml-core
- L’image processeur organisée par défaut est maintenant mcr.microsoft.com/azureml/openmpi3.1.2-ubuntu18.04. L’image GPU par défaut est maintenant mcr.microsoft.com/azureml/openmpi3.1.2-cuda10.2-cudnn8-ubuntu18.04.
- Run.fail() est maintenant déprécié ; utilisez Run.tag() pour marquer l’exécution comme ayant échoué, ou utilisez Run.cancel() pour marquer l’exécution comme annulée.
- Documentation mise à jour avec une remarque indiquant que libfuse doit être installé quand un jeu de données de fichier est monté.
- Ajout de la prise en charge expérimentale de register_dask_dataframe () au jeu de données tabulaire.
- Prise en charge de DatabricksStep avec Azure Blob/ADL-S comme entrées/sorties et exposition des paramètres permit_cluster_restart pour permettre au client de décider si AML peut redémarrer le cluster lorsque la configuration d’accès aux E/S doit être ajoutée au cluster
- azureml-dataset-runtime
- azureml-dataset-runtime prend désormais en charge les versions de pyarrow < 4.0.0
- azureml-mlflow
- Ajout de la prise en charge du déploiement sur Azure Machine Learning via notre plug-in MLFlow.
- azureml-pipeline-steps
- Prise en charge de DatabricksStep avec Azure Blob/ADL-S comme entrées/sorties et exposition des paramètres permit_cluster_restart pour permettre au client de décider si AML peut redémarrer le cluster lorsque la configuration d’accès aux E/S doit être ajoutée au cluster
- azureml-synapse
- Activation de l’audience dans l’authentification msi
- azureml-train-automl-client
- Ajout d’un lien modifié pour le document de cible de calcul
- azureml-automl-runtime
2021-04-19
SDK Azure Machine Learning pour Python v1.27.0
- Résolutions de bogue et améliorations
- azureml-core
- Ajout de la possibilité de remplacer la valeur de délai d’attente par défaut pour le téléchargement d’artefacts via la variable d’environnement « AZUREML_ARTIFACTS_DEFAULT_TIMEOUT ».
- Correction d’un bogue où les paramètres Docker de l’objet Environnement sur ScriptRunConfig ne sont pas respectés.
- Autoriser le partitionnement d’un jeu de données lors de sa copie vers une destination.
- Ajout d’un mode personnalisé à OutputDatasetConfig pour permettre le passage de jeux de données créés dans des pipelines par le biais d’une fonction de liaison. Ces améliorations de prise en charge ont été apportées afin d’activer le partitionnement tabulaire pour PRS.
- Ajout d’un nouveau type de calcul KubernetesCompute à azureml-core.
- azureml-pipeline-core
- Ajout d’un mode personnalisé à OutputDatasetConfig et fonctionnalité permettant à un utilisateur de transmettre des jeux de données créés dans des pipelines via une fonction de liaison. Les destinations des chemins de fichiers prennent en charge les espaces réservés. Ces améliorations de prise en charge ont été apportées afin d’activer le partitionnement tabulaire pour PRS.
- Ajout d’un nouveau type de calcul KubernetesCompute à azureml-core.
- azureml-pipeline-steps
- Ajout d’un nouveau type de calcul KubernetesCompute à azureml-core.
- azureml-synapse
- Mise à jour de l’URL de l’interface utilisateur Spark dans le widget de azureml synapse
- azureml-train-automl-client
- Le caractériseur STL pour la tâche de prévision utilise à présent une détection saisonnière plus robuste basée sur la fréquence de la série chronologique.
- azureml-train-core
- Correction d’un bogue où les paramètres Docker de l’objet Environnement ne sont pas respectés.
- Ajout d’un nouveau type de calcul KubernetesCompute à azureml-core.
- azureml-core
2021-04-05
Kit SDK Azure Machine Learning pour Python v1.26.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Résolution d’un problème où les modèles Naive étaient recommandés dans les exécutions AutoMLStep et échouaient avec des fonctionnalités de retard ou de fenêtre dynamique. Ces modèles ne sont pas recommandés quand des retards cibles ou une taille de fenêtre dynamique cible sont définis.
- Modification de la sortie de la console lors de l’envoi d’une exécution AutoML pour afficher un lien vers l’exécution dans le portail.
- azureml-core
- Mode HDFS ajouté dans la documentation.
- Ajout de la prise en charge pour comprendre les partitions de jeu de données de fichiers de fichier basées sur la structure glob.
- Ajout de la prise en charge de la mise à jour du registre de conteneurs associé à l’espace de travail Azure Machine Learning.
- Les attributs d’environnement dépréciés sous DockerSection, « enabled », « shared_volume » et « arguments » font maintenant partie de DockerConfiguration dans RunConfiguration.
- Mise à jour de la documentation clone de l’interface CLI de pipeline
- URI du portail mis à jour pour inclure le locataire pour l’authentification
- Suppression du nom d’expérience des URI d’exécution pour éviter les redirections
- Mise à jour de l’expérience URO pour utiliser l’ID d’expérience.
- Correctifs de bogues pour l’attachement du calcul distant à l’interface CLI Azure Machine Learning.
- URI du portail mis à jour pour inclure le locataire pour l’authentification.
- URI d’expérimentation mis à jour pour utiliser l’ID d’expérience.
- azureml-interpret
- Mise à jour d’azureml-interpret pour utiliser interpret-community 0.17.0
- azureml-opendatasets
- Validation du type de date de début et de date de fin en entrée, et indication d’erreur s’il ne s’agit pas d’un type DateHeure.
- azureml-parallel-run
- [Fonctionnalité expérimentale] Ajoutez le un paramètre
partition_keys
à ParallelRunConfig, pour que le ou les jeux de données d’entrée soient partitionnés en mini-lots par les clés spécifiées. Cela requiert que tous les jeux de données d’entrée soient partitionnés.
- [Fonctionnalité expérimentale] Ajoutez le un paramètre
- azureml-pipeline-steps
- Correction de bogue : prise en charge de path_on_compute lors du passage de la configuration du jeu de données en téléchargement.
- Dépréciation de RScriptStep en faveur de l’utilisation de CommandStep pour l’exécution de scripts R dans les pipelines.
- Dépréciation d’EstimatorStep en faveur de l’utilisation de CommandStep pour l’exécution de la formation ML (y compris la formation distribuée) dans les pipelines.
- azureml-sdk
- Mise à jour de python_requires vers < 3.9 pour azureml-sdk
- azureml-train-automl-client
- Modification de la sortie de la console lors de l’envoi d’une exécution AutoML pour afficher un lien vers l’exécution dans le portail.
- azureml-train-core
- Attributs enabled, shared_volume et arguments de DockerSection dépréciés en faveur de l’utilisation de DockerConfiguration avec ScriptRunConfig.
- Utilisation d’Azure Open Datasets pour le jeu de données MNIST
- Les messages d’erreur Hyperdrive ont été mis à jour.
- azureml-automl-core
2021-03-22
Kit SDK Azure Machine Learning pour Python v1.25.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Modification de la sortie de la console lors de l’envoi d’une exécution AutoML pour afficher un lien vers l’exécution dans le portail.
- azureml-core
- Début de la prise en charge de la mise à jour du registre de conteneurs pour l’espace de travail dans le SDK et l’interface CLI
- Attributs enabled, shared_volume et arguments de DockerSection dépréciés en faveur de l’utilisation de DockerConfiguration avec ScriptRunConfig.
- Mise à jour de la documentation clone de l’interface CLI de pipeline
- URI du portail mis à jour pour inclure le locataire pour l’authentification
- Suppression du nom d’expérience des URI d’exécution pour éviter les redirections
- Mise à jour de l’expérience URO pour utiliser l’ID d’expérience.
- Correctifs de bogues pour l’attachement de calcul distant avec l’interface az CLI
- URI du portail mis à jour pour inclure le locataire pour l’authentification.
- Ajout de la prise en charge pour comprendre les partitions de jeu de données de fichiers de fichier basées sur la structure glob.
- azureml-interpret
- Mise à jour d’azureml-interpret pour utiliser interpret-community 0.17.0
- azureml-opendatasets
- Validation du type de date de début et de date de fin en entrée, et indication d’erreur s’il ne s’agit pas d’un type DateHeure.
- azureml-pipeline-core
- Correction de bogue : prise en charge de path_on_compute lors du passage de la configuration du jeu de données en téléchargement.
- azureml-pipeline-steps
- Correction de bogue : prise en charge de path_on_compute lors du passage de la configuration du jeu de données en téléchargement.
- Dépréciation de RScriptStep en faveur de l’utilisation de CommandStep pour l’exécution de scripts R dans les pipelines.
- Dépréciation d’EstimatorStep en faveur de l’utilisation de CommandStep pour l’exécution de la formation ML (y compris la formation distribuée) dans les pipelines.
- azureml-train-automl-runtime
- Modification de la sortie de la console lors de l’envoi d’une exécution AutoML pour afficher un lien vers l’exécution dans le portail.
- azureml-train-core
- Attributs enabled, shared_volume et arguments de DockerSection dépréciés en faveur de l’utilisation de DockerConfiguration avec ScriptRunConfig.
- Utilisation d’Azure Open Datasets pour le jeu de données MNIST
- Les messages d’erreur Hyperdrive ont été mis à jour.
- azureml-automl-core
31/03/2021
Expérience Azure Machine Learning Studio avec les notebooks (mise à jour de mars)
Nouvelles fonctionnalités
- Rendu CSV/TSV. Les utilisateurs peuvent afficher un fichier TSV/CSV dans un format de grille pour faciliter l’analyse des données.
- Authentification unique pour l’instance de calcul. Les utilisateurs peuvent désormais facilement authentifier les nouvelles instances de calcul directement dans l’interface utilisateur de Notebook, ce qui facilite l’authentification et l’utilisation des kits SDK Azure directement dans Azure Machine Learning.
- Métriques d’instance de calcul. Les utilisateurs peuvent afficher les métriques de calcul, telles que l’utilisation de l’UC et la mémoire via le terminal.
- Détails du fichier. Les utilisateurs peuvent désormais voir les détails du fichier, notamment l’heure de la dernière modification et la taille du fichier, en cliquant sur les trois points en regard d’un fichier.
Résolutions de bogue et améliorations
- Amélioration des temps de chargement des pages.
- Performances améliorées.
- Amélioration de la vitesse et de la fiabilité du noyau.
- Gain d’immobilier vertical en déplaçant de façon permanente le volet de fichier Notebook vers le haut.
- Les liens sont désormais cliquables dans le terminal.
- Amélioration des performances d’IntelliSense.
08-03-2021
Kit SDK Azure Machine Learning pour Python v1.24.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Suppression des importations à compatibilité descendante de
azureml.automl.core.shared
. Les erreurs de module introuvable dans l’espace de nomsazureml.automl.core.shared
peuvent être résolues en important à partir deazureml.automl.runtime.shared
.
- Suppression des importations à compatibilité descendante de
- azureml-contrib-automl-dnn-vision
- Exposition du modèle yolo de détection d’objets.
- azureml-contrib-dataset
- Ajout de caractéristiques pour filtrer les jeux de données tabulaires par valeurs de colonne, et les jeux de données de fichier par métadonnées.
- azureml-contrib-fairness
- Inclusion du schéma JSON dans wheel pour
azureml-contrib-fairness
- Inclusion du schéma JSON dans wheel pour
- azureml-contrib-mir
- Quand vous affectez la valeur True à show_output lors du déploiement de modèles, la configuration de l’inférence et la configuration du déploiement sont relues avant l’envoi de la requête au serveur.
- azureml-core
- Ajout de caractéristiques pour filtrer les jeux de données tabulaires par valeurs de colonne, et les jeux de données de fichier par métadonnées.
- Auparavant, les utilisateurs avaient la possibilité de créer des configurations de provisionnement destinées aux ComputeTarget qui ne répondaient pas aux exigences du niveau de sécurité du mot de passe pour le champ
admin_user_password
(c’est-à-dire contenir au moins trois des éléments suivants : 1 lettre minuscule, 1 lettre majuscule, 1 chiffre et 1 caractère spécial issu de l’ensemble suivant :\`~!@#$%^&*()=+_[]{}|;:./'",<>?
). Si l’utilisateur créait une configuration avec un mot de passe faible, et qu’il exécutait un travail en utilisant cette configuration, le travail échouait au moment de l’exécution. À présent, l’appel àAmlCompute.provisioning_configuration
lève une exceptionComputeTargetException
avec un message d’erreur associé qui explique les exigences du niveau de sécurité du mot de passe. - Par ailleurs, il était également possible, dans certains cas, de spécifier une configuration avec un nombre de nœuds maximal négatif. Il n’est plus possible de le faire. Désormais,
AmlCompute.provisioning_configuration
lève une exceptionComputeTargetException
si l’argumentmax_nodes
est un entier négatif. - Quand vous affectez la valeur True à show_output lors du déploiement de modèles, la configuration de l’inférence et la configuration du déploiement s’affichent.
- Quand vous affectez la valeur True à show_output lors de l’attente de l’achèvement du déploiement d’un modèle, la progression de l’opération de déploiement s’affiche.
- Autorisation du répertoire de configuration de l’authentification Azure Machine Learning spécifié par le client au moyen de la variable d’environnement : AZUREML_AUTH_CONFIG_DIR
- Auparavant, il était possible de créer une configuration de provisionnement avec un nombre minimal de nœuds inférieur au nombre maximal de nœuds. Le travail s’exécutait mais échouait au moment de l’exécution. Ce bogue est désormais résolu. Si vous essayez à présent de créer une configuration de provisionnement avec
min_nodes < max_nodes
, le kit SDK déclenche une exceptionComputeTargetException
.
- azureml-interpret
- Correction du tableau de bord d’explication n’affichant pas la possibilité d’agréger les importances des caractéristiques pour les explications traitées partiellement.
- Utilisation optimisée de la mémoire de ExplanationClient dans le package azureml-interpret
- azureml-train-automl-client
- Correction de show_output=False pour retourner le contrôle à l’utilisateur lors de l’exécution avec Spark.
- azureml-automl-core
28-02-2021
Expérience Azure Machine Learning studio avec les notebooks (mise à jour de février)
Nouvelles fonctionnalités
- Terminal natif (GA). Les utilisateurs ont désormais accès à un terminal intégré, et à l’opération Git via le terminal intégré.
- Extraits de notebook (préversion). Des extraits de code Azure Machine Learning communs sont maintenant disponibles, à portée de main. Accédez au volet des extraits de code via la barre d’outils, ou activez le menu des extraits de code en utilisant Ctrl + Espace.
- Raccourcis clavier. Parité complète avec les raccourcis clavier disponibles dans Jupyter.
- Indication des paramètres de cellule. Indique aux utilisateurs quelles cellules d’un notebook sont des cellules de paramètres et peut exécuter des notebooks paramétrisables via Papermill sur l’instance de calcul.
- Gestionnaire de session de terminal et de noyau : les utilisateurs sont en mesure de gérer toutes les sessions de noyau et de terminal s’exécutant sur leur calcul.
- Bouton de partage. Les utilisateurs peuvent désormais partager n’importe quel fichier dans l’Explorateur de fichiers du notebook, en cliquant avec le bouton droit sur le fichier et en utilisant le bouton Partager.
Résolutions de bogue et améliorations
- Amélioration des temps de chargement des pages
- performances améliorées
- Amélioration de la vitesse et de la fiabilité du noyau
- Ajout d’une roue en rotation pour afficher la progression de toutes les opérations d’instance de calcul en cours.
- Clic droit dans l’Explorateur de fichiers. Désormais, si vous cliquez avec le bouton droit sur un fichier, l’option Opérations sur les fichiers s’ouvre.
16-02-2021
Kit SDK Azure Machine Learning pour Python v1.23.0
- Résolutions de bogue et améliorations
- azureml-core
- [Caractéristique expérimentale] Ajout de la prise en charge de la liaison de l’espace de travail Synapse dans AML en tant que service lié
- [Caractéristique expérimentale] Ajout de la prise en charge de l’attache d’un pool Synapse Spark dans AML en tant que calcul
- [Caractéristique expérimentale] Ajout de la prise en charge de l’accès aux données basé sur l’identité. Les utilisateurs peuvent inscrire un magasin de données ou des jeux de données sans fournir d’informations d’identification. Dans ce cas, le jeton Azure AD des utilisateurs ou l’identité managée de la cible de calcul est utilisé pour l’authentification. Pour en savoir plus, consultez Se connecter au stockage avec l’accès aux données basé sur l’identité.
- azureml-pipeline-steps
- [Caractéristique expérimentale] Ajout de la prise en charge de SynapseSparkStep
- azureml-synapse
- [Caractéristique expérimentale] Ajout de la prise en charge de Spark Magic pour exécuter une session interactive dans le pool Synapse Spark.
- azureml-core
- Résolutions de bogue et améliorations
- azureml-automl-runtime
- Dans cette mise à jour, nous avons ajouté le lissage exponentiel Holt Winters à la boîte à outils de prévision du kit SDK AutoML. Selon une série chronologique donnée, le meilleur modèle est sélectionné par le critère d’information d’Akaike corrigé (AICc) et retourné.
- AutoML génère désormais deux fichiers journaux au lieu d’un. Les instructions de journalisation sont dirigées vers l’un ou l’autre, selon le processus dans lequel l’instruction de journalisation a été générée.
- Suppression de prévision en échantillon inutile lors de l’entraînement de modèles avec des validations croisées. La durée d’entraînement de modèles peut s’en trouver réduite dans certains cas, en particulier pour les modèles de prévision de série chronologique.
- azureml-contrib-fairness
- Ajout d’un schéma JSON pour les chargements dashboardDictionary.
- azureml-contrib-interpret
- Mise à jour du fichier Lisez-moi d’azureml-contrib-interpret pour prévenir de la suppression du package lors de la prochaine mise à jour, et pour faire suite à sa dépréciation depuis octobre ; utilisez le package azureml-interpret à la place.
- azureml-core
- Auparavant, il était possible de créer une configuration de provisionnement avec un nombre minimal de nœuds inférieur au nombre maximal de nœuds. Ce bogue est désormais corrigé. Si vous essayez à présent de créer une configuration de provisionnement avec
min_nodes < max_nodes
, le kit SDK déclenche une exceptionComputeTargetException
. - Correction du bogue dans wait_for_completion de AmlCompute, qui a entraîné le retour du flux de contrôle par la fonction avant la fin réelle de l’opération.
- Run.fail() est maintenant déprécié ; utilisez Run.tag() pour marquer l’exécution comme ayant échoué, ou utilisez Run.cancel() pour marquer l’exécution comme annulée.
- Affichage du message d’erreur « Nom de l’environnement attendu str, {} a été trouvé » lorsque le nom d’environnement fourni n’est pas une chaîne.
- Auparavant, il était possible de créer une configuration de provisionnement avec un nombre minimal de nœuds inférieur au nombre maximal de nœuds. Ce bogue est désormais corrigé. Si vous essayez à présent de créer une configuration de provisionnement avec
- azureml-train-automl-client
- Correction d’un bogue qui empêchait l’annulation des expériences AutoML effectuées sur les clusters Azure Databricks.
- azureml-automl-runtime
09/02/2021
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.22.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Correction d'un bogue qui entraînait l'ajout d'une dépendance PIP supplémentaire au fichier Conda yml pour les modèles de vision.
- azureml-automl-runtime
- Correction d’un bogue qui permettait aux modèles de prévisions classiques (par exemple, AutoArima) de recevoir des données d’entraînement dans lesquelles les lignes comportant des valeurs cibles imputées étaient absentes. Cela enfreignait le contrat de données de ces modèles. * Correction de divers bogues qui entraînaient un comportement de décalage par occurrence dans l'opérateur de décalage des séries chronologiques. Auparavant, l’opération de décalage par occurrence ne marquait pas correctement toutes les lignes imputées et ne générait donc pas toujours les valeurs de décalage d’occurrence appropriées. Correction de certains problèmes de compatibilité entre l'opérateur de décalage et l'opérateur de fenêtre dynamique en ce qui concerne le comportement de décalage par occurrence. Ainsi, auparavant, l'opérateur de fenêtre dynamique supprimait des données d'apprentissage certaines lignes qu'il aurait dû utiliser.
- azureml-core
- Ajout de la prise en charge de l'authentification par jeton par le public.
- Ajout de
process_count
à PyTorchConfiguration pour prendre en charge les tâches PyTorch multiprocessus et à nœuds multiples.
- azureml-pipeline-steps
CommandStep est désormais en GA et n'est donc plus expérimental.
ParallelRunConfig : ajout d'argument allowed_failed_count et d'allowed_failed_percent pour vérifier le seuil d'erreur au niveau du mini-lot. Le seuil d'erreur comporte maintenant trois saveurs :
- error_threshold : nombre d'éléments de mini-lots ayant échoué autorisés ;
- allowed_failed_count : nombre de mini-lots ayant échoué autorisés ;
- allowed_failed_percent : pourcentage de mini-lots ayant échoué.
Un travail s’arrête s’il dépasse l’un d’eux. error_threshold est requis pour assurer la compatibilité descendante. Définissez la valeur sur -1 pour l'ignorer.
Correction de la gestion des espaces blancs dans le nom AutoMLStep.
ScriptRunConfig est désormais pris en charge par HyperDriveStep
- azureml-train-core
- Les exécutions HyperDrive appelées à partir d'un ScriptRun sont désormais considérées comme des exécutions enfants.
- Ajout de
process_count
à PyTorchConfiguration pour prendre en charge les tâches PyTorch multiprocessus et à nœuds multiples.
- azureml-widgets
- Ajout du widget ParallelRunStepDetails pour visualiser l'état d'un ParallelRunStep.
- Permet aux utilisateurs d'HyperDrive de voir un axe sur le graphique des coordonnées parallèles, qui affiche la valeur de la métrique correspondant à chaque ensemble d'hyperparamètres pour chaque exécution enfant.
- azureml-automl-core
2021-01-31
Expérience Azure Machine Learning Studio avec les notebooks (mise à jour de janvier)
Nouvelles fonctionnalités
- Éditeur Markdown natif dans Azure Machine Learning. Les utilisateurs peuvent désormais afficher et modifier des fichiers Markdown en mode natif dans Azure Machine Learning Studio.
- Bouton Exécuter pour les scripts (.py, .R et .sh). Les utilisateurs peuvent désormais exécuter facilement des scripts Python, R et Bash dans Azure Machine Learning.
- Explorateur de variables. Explorez le contenu des variables et des trames de données dans un panneau contextuel. Les utilisateurs peuvent facilement vérifier le type de données, la taille et le contenu.
- Table des matières. Accédez aux sections de votre notebook, indiquées par des en-têtes Markdown.
- Exportez votre notebook au format LaTex/HTML/Py. Créez des fichiers de notebook faciles à partager en les exportant au format LaTex, HTML ou .py
- IntelliCode. Les résultats alimentés par ML fournissent une expérience de saisie semi-automatique intelligente améliorée.
Résolutions de bogue et améliorations
- Amélioration des temps de chargement des pages
- performances améliorées
- Amélioration de la vitesse et de la fiabilité du noyau
25-01-2021
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.21.0
- Résolutions de bogue et améliorations
- azure-cli-ml
- Correction du texte d’aide CLI lors de l’utilisation d’AmlCompute avec l’identité UserAssigned
- azureml-contrib-automl-dnn-vision
- Les boutons de déploiement et de téléchargement deviennent visibles pour les exécutions de visions AutoML, et des modèles peuvent être déployés ou téléchargés de la même façon que d’autres exécutions AutoML. Il existe deux nouveaux fichiers (scoring_file_v_1_0_0.py et conda_env_v_1_0_0.yml) contenant un script permettant d’exécuter l’inférence et un fichier yml pour recréer l’environnement conda. Le fichier « model.pth » a également été renommé pour utiliser l’extension « .pt ».
- azureml-core
- Prise en charge MSI pour azure-cli-ml
- Prise en charge d’une identité managée affectée par l’utilisateur.
- Avec cette modification, les clients doivent être en mesure de fournir à l’utilisateur une identité qui peut être utilisée pour extraire la clé du coffre de clés du client en vue du chiffrement au repos.
- Correction de row_count=0 pour le profil de fichiers volumineux ; correction de l’erreur de double conversion pour les valeurs délimitées avec remplissage par des espaces blancs
- Supprimer l’indicateur expérimental pour Output dataset GA
- Mettre à jour la documentation sur l’extraction d’une version spécifique d’un modèle
- Possibilité donnée de mettre à jour l’espace de travail pour l’accès en mode mixte dans un lien privé
- Correctif permettant de supprimer une autre inscription sur le magasin de données pour la fonctionnalité Reprendre l’exécution
- Ajout de la prise en charge de CLI/SDK pour la mise à jour de l’identité affectée par l’utilisateur principal d’un espace de travail
- azureml-interpret
- mise à jour d’azureml-interpret en interpret-community 0.16.0
- optimisations de la mémoire pour le client d’explication dans azureml-interpret
- azureml-train-automl-runtime
- activation de la diffusion en continu pour les exécutions ADB
- azureml-train-core
- Correctif permettant de supprimer une autre inscription sur le magasin de données pour la fonctionnalité Reprendre l’exécution
- azureml-widgets
- Les clients ne devraient pas voir les modifications apportées à la visualisation des données d’exécution existante à l’aide du widget, et ils bénéficient désormais d’un support s’ils utilisent des hyperparamètres conditionnels.
- Le widget d’exécution de l’utilisateur comprend désormais une explication détaillée de la raison pour laquelle une exécution se trouve à l’état Mis en file d’attente.
- azure-cli-ml
2021-01-11
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.20.0
- Résolutions de bogue et améliorations
- azure-cli-ml
- framework_version ajouté dans OptimizationConfig. Est utilisé lors de l’inscription du modèle auprès du framework MULTI.
- azureml-contrib-optimization
- framework_version ajouté dans OptimizationConfig. Est utilisé lors de l’inscription du modèle auprès du framework MULTI.
- azureml-pipeline-steps
- Introduction de CommandStep qui prendra la commande à traiter. à savoir des exécutables, des commandes shell, des scripts, etc.
- azureml-core
- Ajout de la prise en charge de l’identité affectée par l’utilisateur dans la création de l’espace de travail. Ajout de la prise en charge UAI à partir du kit SDK/de l’interface CLI.
- Résolution du problème de service.reload() pour récupérer les modifications effectuées sur score.py dans un déploiement local.
- Ajout à
run.get_details()
d’un champ supplémentaire nommé « submittedBy », qui affiche le nom de l’auteur de cette série. - Modification de la documentation de la méthode Model.register de façon à mentionner comment inscrire directement le modèle à partir de l’exécution.
- Résolution du problème de gestion des modifications de l’état de la connexion au serveur IOT.
- azure-cli-ml
2020-12-31
Expérience Azure Machine Learning Studio avec les notebooks (mise à jour de décembre)
Nouvelles fonctionnalités
- Recherche de nom de fichier par l’utilisateur. Les utilisateurs peuvent désormais effectuer une recherche dans tous les fichiers enregistrés dans un espace de travail.
- Support côte à côte de Markdown par cellule de notebook. Dans une cellule de notebook, les utilisateurs peuvent désormais choisir d’afficher côte à côte la syntaxe Markdown et Markdown rendue.
- Barre d’état de la cellule. La barre d’état indique l’état dans lequel se trouve une cellule de code, si l’exécution d’une cellule a réussi et le temps nécessaire à son exécution.
Résolutions de bogue et améliorations
- Amélioration des temps de chargement des pages
- performances améliorées
- Amélioration de la vitesse et de la fiabilité du noyau
2020-12-07
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.19.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Ajout de la prise en charge expérimentale des données de test à AutoMLStep.
- Ajout de l’implémentation principale initiale de la fonctionnalité d’ingestion de jeux de test.
- Les références déplacées vers sklearn.externals.joblib dépendent directement de joblib.
- Introduction d’un nouveau type de tâche AutoML « image-instance-segmentation ».
- azureml-automl-runtime
- Ajout de l’implémentation principale initiale de la fonctionnalité d’ingestion de jeux de test.
- Lorsque toutes les chaînes d’une colonne de texte ont une longueur d’exactement un caractère, le caractériseur de mot-gramme TfIdf ne fonctionne pas, car son générateur de jetons ignore les chaînes contenant moins de deux caractères. Cette modification du code permet à AutoML de gérer ce cas d’usage.
- Introduction d’un nouveau type de tâche AutoML « image-instance-segmentation ».
- azureml-contrib-automl-dnn-nlp
- Demande de tirage (pull request) initiale pour le nouveau package dnn-nlp.
- azureml-contrib-automl-dnn-vision
- Introduction d’un nouveau type de tâche AutoML « image-instance-segmentation ».
- azureml-contrib-automl-pipeline-steps
- Ce nouveau package est responsable de la création des étapes requises pour de nombreux scénarios de formation/d’inférence de modèles. Il déplace également le code de formation/d’inférence dans le package azureml.train.automl.runtime afin que tous les correctifs ultérieurs soient automatiquement disponibles par le biais des versions organisées de l’environnement.
- azureml-contrib-dataset
- Introduction d’un nouveau type de tâche AutoML « image-instance-segmentation ».
- azureml-core
- Ajout de l’implémentation principale initiale de la fonctionnalité d’ingestion de jeux de test.
- Correction des avertissements XREF pour la documentation dans le package azureml-core.
- Correction des chaînes doc pour la fonctionnalité de prise en charge de Command dans le Kit de développement logiciel (SDK).
- Ajout de la propriété Command à RunConfiguration. Cette fonctionnalité permet aux utilisateurs d’exécuter une commande ou des exécutables sur le calcul via le SDK Azure Machine Learning.
- Les utilisateurs peuvent supprimer une expérience vide en fonction de l’ID de cette expérience.
- azureml-dataprep
- Ajout de la prise en charge des jeux de données pour Spark générés avec Scala 2.12. Cela s’ajoute à la prise en charge existante de la version 2.11.
- azureml-mlflow
- AzureML-MLflow ajoute des protecteurs dans les scripts distants pour éviter l’arrêt prématuré des exécutions soumises.
- azureml-pipeline-core
- Correction d’un bogue lors de la définition d’un pipeline par défaut pour le point de terminaison du pipeline créé via l’interface utilisateur.
- azureml-pipeline-steps
- Ajout de la prise en charge expérimentale des données de test à AutoMLStep.
- azureml-tensorboard
- Correction des avertissements XREF pour la documentation dans le package azureml-core.
- azureml-train-automl-client
- Ajout de la prise en charge expérimentale des données de test à AutoMLStep.
- Ajout de l’implémentation principale initiale de la fonctionnalité d’ingestion de jeux de test.
- Introduction d’un nouveau type de tâche AutoML « image-instance-segmentation ».
- azureml-train-automl-runtime
- Ajout de l’implémentation principale initiale de la fonctionnalité d’ingestion de jeux de test.
- Correction du calcul des explications brutes pour le meilleur modèle AutoML si les modèles AutoML sont formés à l’aide du paramètre validation_size.
- Les références déplacées vers sklearn.externals.joblib dépendent directement de joblib.
- azureml-train-core
HyperDriveRun.get_children_sorted_by_primary_metric() doit désormais se terminer plus rapidement.
Amélioration de la gestion des erreurs dans le Kit de développement logiciel (SDK) HyperDrive.
Dépréciation de toutes les classes d’estimateur en faveur de l’utilisation de ScriptRunConfig pour configurer des exécutions d’expériences. Les classes déconseillées sont les suivantes :
- MMLBase
- Estimateur
- PyTorch
- TensorFlow
- Chainer
- SKLearn
Dépréciation de l’utilisation de Nccl et Gloo comme types d’entrée valides pour les classes Estimator en faveur de l’utilisation de PyTorchConfiguration avec ScriptRunConfig.
Dépréciation de l’utilisation de Mpi comme type d’entrée valide pour les classes Estimator en faveur de l’utilisation de MpiConfiguration avec ScriptRunConfig.
Ajout de la propriété Command à la configuration d’exécution. Cette fonctionnalité permet aux utilisateurs d’exécuter une commande ou des exécutables sur le calcul via le SDK Azure Machine Learning.
Dépréciation de toutes les classes d’estimateur en faveur de l’utilisation de ScriptRunConfig pour configurer des exécutions d’expériences. Les classes déconseillées sont les suivantes : + MMLBaseEstimator + Estimator + PyTorch + TensorFlow + Chainer + SKLearn.
Dépréciation de l’utilisation de Nccl et Gloo comme type d’entrée valide pour les classes Estimator en faveur de l’utilisation de PyTorchConfiguration avec ScriptRunConfig.
Dépréciation de l’utilisation de Mpi comme type d’entrée valide pour les classes Estimator en faveur de l’utilisation de MpiConfiguration avec ScriptRunConfig.
- azureml-automl-core
2020-11-30
Expérience Azure Machine Learning Studio avec les notebooks (mise à jour de novembre)
Nouvelles fonctionnalités
- Terminal natif. Les utilisateurs ont désormais accès à un terminal intégré, et à l’opération Git via le terminal intégré.
- Dossier dupliqué
- Baisse des coûts de calcul
- Calcul Pylance hors connexion
Résolutions de bogue et améliorations
- Amélioration des temps de chargement des pages
- performances améliorées
- Amélioration de la vitesse et de la fiabilité du noyau
- Chargement de fichiers volumineux. Vous pouvez maintenant charger les fichiers d’une taille > à 95 Mo
09-11-2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.18.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Amélioration de la gestion des séries chronologiques en autorisant leur remplissage avec un bruit gaussien.
- azureml-automl-runtime
- Lève une exception ConfigException si une colonne DateTime contient une valeur OutOfBoundsDatetime
- Amélioration de la gestion des séries chronologiques en autorisant leur remplissage avec un bruit gaussien.
- S’assurer que chaque colonne de texte peut utiliser la transformation char-gram avec la plage n-gram en fonction de la longueur des chaînes de cette colonne de texte
- Fournir des explications de fonctionnalités brutes pour le meilleur mode pour les expériences AutoML exécutées sur le calcul local de l’utilisateur
- azureml-core
- Épinglez le package : pyjwt pour éviter d’extraire d’interrompre des versions dans les prochaines versions.
- La création d’une expérience retourne l’expérience active ou la dernière expérience archivée avec le même nom donné, si une telle expérience existe, ou une nouvelle expérience.
- L’appel de get_experiment par son nom retourne l’expérience active ou la dernière expérience archivée avec le nom donné.
- Les utilisateurs ne peuvent pas renommer une expérience en cours de réactivation.
- Message d’erreur amélioré pour inclure des correctifs potentiels lorsqu’un jeu de données est transmis incorrectement à une expérience (par exemple, ScriptRunConfig).
- Documentation améliorée pour
OutputDatasetConfig.register_on_complete
afin d’inclure le comportement de ce qui se produit lorsque le nom existe déjà. - La spécification des noms d’entrée et de sortie de jeu de données susceptibles d’entrer en conflit avec des variables d’environnement communes génère désormais un avertissement
- Réaffectation du paramètre
grant_workspace_access
lors de l’inscription des magasins de données. Affectez-lui la valeurTrue
pour accéder aux données derrière le réseau virtuel à partir de Machine Learning Studio. En savoir plus - L’API de service liée est affinée. Au lieu de fournir l’ID de ressource, nous utilisons trois paramètres distincts sub_id, rg, et name, définis dans la configuration.
- Pour permettre aux clients de résoudre eux-mêmes les problèmes d’altération des jetons, activez la synchronisation des jetons de l’espace de travail en tant que méthode publique.
- Cette modification permet d’utiliser une chaîne vide comme valeur pour script_param
- azureml-train-automl-client
- Amélioration de la gestion des séries chronologiques en autorisant leur remplissage avec un bruit gaussien.
- azureml-train-automl-runtime
- Lève une exception ConfigException si une colonne DateTime contient une valeur OutOfBoundsDatetime
- Ajout de la prise en charge pour fournir des explications de fonctionnalités brutes pour le meilleur mode pour les expériences AutoML exécutées sur le calcul local de l’utilisateur
- Amélioration de la gestion des séries chronologiques en autorisant leur remplissage avec un bruit gaussien.
- azureml-train-core
- Cette modification permet d’utiliser une chaîne vide comme valeur pour script_param
- azureml-train-restclients-hyperdrive
- Le fichier LISEZ-MOI a été modifié pour fournir plus de contexte
- azureml-widgets
- Ajout de la prise en charge des chaînes à des graphiques/bibliothèque de coordonnées parallèles pour le widget.
- azureml-automl-core
05-11-2020
Étiquetage des données pour la segmentation d’instance d’image (annotation de polygone) (préversion)
Le type de projet de segmentation d’instance d’image (annotations de polygone) dans l’étiquetage des données est maintenant disponible. Les utilisateurs peuvent ainsi dessiner et annoter des polygones autour du contour des objets dans les images. Les utilisateurs peuvent affecter une classe et un polygone à chaque objet pertinent dans une image.
En savoir plus sur l’étiquetage de segmentation d’une instance d’image.
2020-10-26
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.17.0
- nouveaux exemples
- Un nouveau référentiel d’exemples alimenté par la communauté est disponible à l’adresse https://github.com/Azure/azureml-examples
- Résolutions de bogue et améliorations
- azureml-automl-core
- Correction d’un problème lié au déclenchement d’une erreur XGBoostError par get_output.
- azureml-automl-runtime
- Les fonctionnalités basées sur l’heure ou le calendrier créées par AutoML disposent désormais du préfixe.
- Correction d’une erreur IndexError qui se produit lors de la formation de StackEnsemble pour les jeux de données de classification comportant un grand nombre de classes et sur lesquels le sous-échantillonnage est activé.
- Correction d’un problème lié à la délivrance de prédictions VotingRegressor inexactes après réajustement du modèle.
- azureml-core
- Ajout de détails supplémentaires sur la relation entre la configuration de déploiement AKS et les concepts d’Azure Kubernetes Service.
- Prise en charge des étiquettes des clients d’environnement. L’utilisateur peut étiqueter les environnements et y faire référence par étiquette.
- azureml-dataprep
- Amélioration du message d’erreur lors de l’utilisation de Spark avec Scala 2.12, actuellement non pris en charge.
- azureml-explain-model
- Le package azureml-explain-model est officiellement déconseillé
- azureml-mlflow
- Résolution d’un bogue dans mlflow.projects.run sur le back-end azureml, lié à la gestion incorrecte de l’état En cours de finalisation.
- azureml-pipeline-core
- Ajout de la prise en charge de la création, du recensement et de l’obtention du calendrier de pipeline basé sur un point de terminaison de pipeline.
- Amélioration de la documentation de PipelineData.as_dataset avec un exemple d’utilisation non valide. L’utilisation incorrecte de PipelineData.as_dataset provoque désormais le déclenchement d’une erreur ValueException
- Modification du notebook de pipelines HyperDriveStep pour enregistrer le meilleur modèle dans un PipelineStep directement après l’exécution de HyperDriveStep.
- azureml-pipeline-steps
- Modification du notebook de pipelines HyperDriveStep pour enregistrer le meilleur modèle dans un PipelineStep directement après l’exécution de HyperDriveStep.
- azureml-train-automl-client
- Correction d’un problème lié au déclenchement d’une erreur XGBoostError par get_output.
- azureml-automl-core
Expérience Azure Machine Learning Studio avec les notebooks (mise à jour d’octobre)
Nouvelles fonctionnalités
- Prise en charge de réseau virtuel complet
- Mode Focus
- Enregistrer les blocs-notes Ctrl-S
- Numéros de ligne
Résolutions de bogue et améliorations
- Amélioration de la vitesse et de la fiabilité du noyau
- Mises à jour de l’interface utilisateur du widget Jupyter
12-10-2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.16.0
- Résolutions de bogue et améliorations
- azure-cli-ml
- AKSWebservice et AKSEndpoints prennent désormais en charge les limites de ressources de processeur et de mémoire au niveau pod. Ces limites facultatives peuvent être utilisées en définissant les indicateurs
--cpu-cores-limit
et--memory-gb-limit
dans les appels CLI applicables.
- AKSWebservice et AKSEndpoints prennent désormais en charge les limites de ressources de processeur et de mémoire au niveau pod. Ces limites facultatives peuvent être utilisées en définissant les indicateurs
- azureml-core
- Épingler les versions majeures de dépendances directes d’azureml-core
- AKSWebservice et AKSEndpoints prennent désormais en charge les limites de ressources de processeur et de mémoire au niveau pod. Pour en savoir plus, accédez à Kubernetes Resources and Limits (Ressources et limites de Kubernetes).
- Mise à jour de run.log_table pour autoriser la consignation de lignes individuelles.
- Ajout de la méthode statique
Run.get(workspace, run_id)
pour récupérer une exécution uniquement à l’aide d’un espace de travail. - Ajout de la méthode d’instance
Workspace.get_run(run_id)
pour récupérer une exécution dans l’espace de travail. - Présentation de la propriété de commande dans la configuration d’exécution, qui permet aux utilisateurs d’envoyer une commande au lieu de scripts et d’arguments.
- azureml-interpret
- Correction du comportement de l’indicateur is_raw client dans azureml-interpréter
- azureml-sdk
azureml-sdk
prend officiellement en charge Python 3.8.
- azureml-train-core
- Ajout de l’environnement organisé TensorFlow 2.3
- Présentation de la propriété de commande dans la configuration d’exécution, qui permet aux utilisateurs d’envoyer une commande au lieu de scripts et d’arguments.
- azureml-widgets
- Modification de l’interface pour le widget d’exécution de script.
- azure-cli-ml
28/09/2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.15.0
- Résolutions de bogue et améliorations
- azureml-contrib-interpret
- Explicateur LIME déplacé du package azureml-contrib-interpret vers le package interpret-community et explicateur d’images supprimé du package azureml-contrib-interpret
- Tableau de bord de visualisation supprimé du package azureml-contrib-interpret, client d’explication déplacé vers le package azureml-interpret et déconseillé dans le package azureml-contrib-interpret et notebooks mis à jour pour refléter l’amélioration de l’API
- Correction des descriptions de packages PyPI pour les packages azureml-interpret, azureml-explain-model, azureml-contrib-interpret et azureml-tensorboard
- azureml-contrib-notebook
- Dépendance nbcovert épinglée à < 6 pour que papermill 1.x continue à fonctionner.
- azureml-core
- Ajout de paramètres à TensorflowConfiguration et MpiConfiguration pour permettre une initialisation plus rationalisée des attributs de classe sans que l’utilisateur soit obligé de définir chaque attribut individuel. Ajout d’une classe PyTorchConfiguration pour la configuration des tâches PyTorch distribuées dans ScriptRunConfig.
- Version du package azure-mgmt-resource épinglée pour corriger l’erreur d’authentification.
- Prise en charge du déploiement Triton sans code.
- Les répertoires de sortie spécifiés dans Run.start_logging() sont désormais suivis lors de l’utilisation de l’exécution dans des scénarios interactifs. Les fichiers suivis sont visibles sur ML Studio lorsque la fonction Run.complete() est appelée.
- L’encodage de fichier peut maintenant être spécifié lors de la création du jeu de données avec
Dataset.Tabular.from_delimited_files
etDataset.Tabular.from_json_lines_files
en transmettant l’argumentencoding
. Les encodages pris en charge sont « utf8 », « iso88591 », « latin1 », « ascii », « utf16 », « utf32 », « utf8bom » et « windows1252 ». - Résolution de bogue dans lequel l’objet environnement n’est pas transmis au constructeur ScriptRunConfig.
- Mise à jour de la fonction Run.cancel() pour autoriser l’annulation d’une exécution locale à partir d’un autre ordinateur.
- azureml-dataprep
- Résolution des problèmes d’expiration du délai d’attente lors du montage du jeu de données.
- azureml-explain-model
- Correction des descriptions de packages PyPI pour les packages azureml-interpret, azureml-explain-model, azureml-contrib-interpret et azureml-tensorboard
- azureml-interpret
- Tableau de bord de visualisation supprimé du package azureml-contrib-interpret, client d’explication déplacé vers le package azureml-interpret et déconseillé dans le package azureml-contrib-interpret et notebooks mis à jour pour refléter l’amélioration de l’API
- Mise à jour du package azureml-interpret pour dépendre du package interpret-community 0.15.0
- Correction des descriptions de packages PyPI pour les packages azureml-interpret, azureml-explain-model, azureml-contrib-interpret et azureml-tensorboard
- azureml-pipeline-core
- Résolution du problème de pipeline avec
OutputFileDatasetConfig
où le système peut cesser de répondre lorsqueregister_on_complete
est appelé avec le paramètrename
défini sur un nom de jeu de données préexistant.
- Résolution du problème de pipeline avec
- azureml-pipeline-steps
- Suppression des notebooks Databricks obsolètes.
- azureml-tensorboard
- Correction des descriptions de packages PyPI pour les packages azureml-interpret, azureml-explain-model, azureml-contrib-interpret et azureml-tensorboard
- azureml-train-automl-runtime
- Tableau de bord de visualisation supprimé du package azureml-contrib-interpret, client d’explication déplacé vers le package azureml-interpret et déconseillé dans le package azureml-contrib-interpret et notebooks mis à jour pour refléter l’amélioration de l’API
- azureml-widgets
- Tableau de bord de visualisation supprimé du package azureml-contrib-interpret, client d’explication déplacé vers le package azureml-interpret et déconseillé dans le package azureml-contrib-interpret et notebooks mis à jour pour refléter l’amélioration de l’API
- azureml-contrib-interpret
2020-09-21
Kit SDK Azure Machine Learning pour Python v1.14.0
- Résolutions de bogue et améliorations
azure-cli-ml
- Le profilage de grille a été supprimé du SDK et n’est plus pris en charge.
azureml-accel-models
- Le package azureml-accel-models prend à présent en charge TensorFlow 2.x
azureml-automl-core
- Ajout de la gestion des erreurs dans get_output dans les cas où les versions locales de pandas/sklearn ne correspondent pas à celles utilisées lors de l’apprentissage
azureml-automl-runtime
- Correction d’un bogue dans lequel les itérations AutoArima échouent avec un PredictionException et le message suivant : « Une défaillance silencieuse s’est produite pendant la prédiction. »
azureml-cli-common
- Le profilage de grille a été supprimé du SDK et n’est plus pris en charge.
azureml-contrib-server
- Mise à jour de la description du package pour la page de présentation pypi.
azureml-core
- Le profilage de grille a été supprimé du SDK et n’est plus pris en charge.
- Réduction du nombre de messages d’erreur lors de l’échec de la récupération de l’espace de travail.
- Ne pas afficher d’avertissement en cas d’échec de la récupération des métadonnées
- Nouvelle étape Kusto et nouvelle cible de calcul Kusto.
- Mise à jour du document pour le paramètre SKU. Suppression de la référence SKU de la fonctionnalité de mise à jour de l’espace de travail dans l’interface CLI et le SDK.
- Mise à jour de la description du package pour la page de présentation Pypi.
- Mise à jour de la documentation pour les environnements Azure Machine Learning.
- Exposition des paramètres des ressources managées par le service pour l’espace de travail AML dans le SDK.
azureml-dataprep
- Activation de l’autorisation Execute sur les fichiers pour le montage du jeu de données.
azureml-mlflow
- Mise à jour de la documentation et des exemples de notebooks MLflow Azure Machine Learning
- Nouvelle prise en charge des projets MLflow avec le back-end Azure Machine Learning
- Prise en charge du registre de modèles MLflow
- Ajout de la prise en charge d’Azure RBAC pour les opérations AzureML-MLflow
azureml-pipeline-core
- Amélioration de la documentation des méthodes PipelineOutputFileDataset.parse_*.
- Nouvelle étape Kusto et nouvelle cible de calcul Kusto.
- La propriété Swaggerurl fournie pour l’entité de point de terminaison de pipeline via cet utilisateur peut voir la définition de schéma pour le point de terminaison de pipeline publié.
azureml-pipeline-steps
- Nouvelle étape Kusto et nouvelle cible de calcul Kusto.
azureml-telemetry
- Mise à jour de la description du package pour la page de présentation pypi.
azureml-train
- Mise à jour de la description du package pour la page de présentation pypi.
azureml-train-automl-client
- Ajout de la gestion des erreurs dans get_output dans les cas où les versions locales de pandas/sklearn ne correspondent pas à celles utilisées lors de l’apprentissage
azureml-train-core
- Mise à jour de la description du package pour la page de présentation pypi.
2020-08-31
Kit SDK Azure Machine Learning pour Python v1.13.0
Fonctionnalités préliminaires
- azureml-core Avec la nouvelle fonctionnalité de jeux de données de sortie, vous pouvez mettre à jour dans le stockage cloud, notamment les objets blob, ADLS Gen 1, ADLS Gen 2 et FileShare. Vous pouvez configurer l’emplacement de sortie des données, le mode de sortie des données (montage ou chargement), l’enregistrement des données de sortie pour une réutilisation ultérieure ainsi que le partage et la transmission des données intermédiaires entre les étapes de pipeline en toute transparence. Cela permet la reproductibilité, le partage, empêche la duplication des données et génère des gains de productivité et de rentabilité. Découvrez son utilisation
Résolutions de bogue et améliorations
- azureml-automl-core
- Ajout du fichier validated_{platform}_requirements.txt pour épingler toutes les dépendances PIP pour AutoML.
- Cette version prend en charge des modèles de plus de 4 Go.
- Mise à niveau des dépendances AutoML :
scikit-learn
(maintenant 0.22.1),pandas
(maintenant 0.25.1) etnumpy
(Now 1.18.2).
- azureml-automl-runtime
- Définition de horovod pour que les DNN de texte utilisent toujours la compression fp16.
- Cette version prend en charge des modèles de plus de 4 Go.
- Correction du problème dans lequel AutoML échoue avec ImportError : impossible d’importer le nom
RollingOriginValidator
. - Mise à niveau des dépendances AutoML :
scikit-learn
(maintenant 0.22.1),pandas
(maintenant 0.25.1) etnumpy
(Now 1.18.2).
- azureml-contrib-automl-dnn-forecasting
- Mise à niveau des dépendances AutoML :
scikit-learn
(maintenant 0.22.1),pandas
(maintenant 0.25.1) etnumpy
(Now 1.18.2).
- Mise à niveau des dépendances AutoML :
- azureml-contrib-fairness
- Brève description d’azureml-contrib-fairness.
- azureml-contrib-pipeline-steps
- Ajout d’un message indiquant que ce package est déprécié et que l’utilisateur devrait utiliser azureml-pipeline-steps à la place.
- azureml-core
- Ajout de la commande de clé de liste pour l’espace de travail.
- Ajout d’un paramètre de balises dans le kit de développement logiciel (SDK) de l’espace de travail et l’interface CLI.
- Correction du bogue dans lequel l’envoi d’une exécution enfant avec un jeu de données échoue en raison de
TypeError: can't pickle _thread.RLock objects
. - Ajout de la valeur par défaut/documentation de page_count pour la liste de modèles().
- Modification de l’interface CLI et du kit de développement logiciel (SDK) pour prendre le paramètre adbworkspace et ajout d’un espace de travail adb lier/dissocier le testeur.
- Correction du bogue dans Dataset.update qui entraînait la mise à jour de la version la plus récente du jeu de données et non de la version de la mise à jour du jeu de données qui était appelée.
- Correction du bogue dans Dataset.get_by_name qui affichait les balises pour la version la plus récente du jeu de données même lorsqu’une version antérieure spécifique était récupérée.
- azureml-interpret
- Ajout des sorties de probabilité aux explicateurs de scoring SHAP dans azureml-interpret en fonction du paramètre shap_values_output de l’explicateur d’origine.
- azureml-pipeline-core
- Documentation de
PipelineOutputAbstractDataset.register
améliorée.
- Documentation de
- azureml-train-automl-client
- Mise à niveau des dépendances AutoML :
scikit-learn
(maintenant 0.22.1),pandas
(maintenant 0.25.1) etnumpy
(Now 1.18.2).
- Mise à niveau des dépendances AutoML :
- azureml-train-automl-runtime
- Mise à niveau des dépendances AutoML :
scikit-learn
(maintenant 0.22.1),pandas
(maintenant 0.25.1) etnumpy
(Now 1.18.2).
- Mise à niveau des dépendances AutoML :
- azureml-train-core
- Les utilisateurs doivent maintenant fournir un argument hyperparameter_sampling valide lors de la création d’une configuration HyperDriveConfig. De plus, la documentation de HyperDriveRunConfig a été modifiée pour informer les utilisateurs de la dépréciation de HyperDriveRunConfig.
- Restauration de la version par défaut de PyTorch vers 1.4.
- Ajout d’images PyTorch 1.6 et TensorFlow 2.2 et d’un environnement organisé.
- azureml-automl-core
Expérience Azure Machine Learning Studio avec les notebooks (mise à jour d’août)
Nouvelles fonctionnalités
- Nouvelle page d’accueil de prise en main
Fonctionnalités préliminaires
- Fonctionnalité de regroupement dans les notebooks. Grâce à la fonctionnalité de regroupement, les utilisateurs peuvent désormais facilement nettoyer les notebooks. Le regroupement utilise une analyse de dépendance automatisée de votre notebook, ce qui garantit que le code essentiel est conservé, tout en supprimant les éléments non pertinents.
Résolutions de bogue et améliorations
- Amélioration de la vitesse et de la fiabilité
- Résolution des bogues en mode sombre
- Résolution des bogues de défilement de sortie
- L’exemple de recherche cherche désormais dans tout le contenu de la totalité des fichiers de l’exemples de référenties de notebooks Azure Machine Learning
- Les cellules R à plusieurs lignes peuvent maintenant s’exécuter
- « Je fais confiance au contenu de ce fichier » est maintenant vérifié automatiquement après la première exécution
- Amélioration de la boîte de dialogue de résolution des conflits avec une option « Créer une copie »
17/08/2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.12.0
- Résolutions de bogue et améliorations
- azure-cli-ml
- Ajout des paramètres image_name et image_label à Model.package() pour permettre le changement de nom de l’image de package générée.
- azureml-automl-core
- AutoML génère un nouveau code d’erreur à partir de dataprep lorsque le contenu est modifié lors de la lecture.
- azureml-automl-runtime
- Ajout d’alertes pour l’utilisateur lorsque les données contiennent des valeurs manquantes, mais que l’ingénierie de caractéristiques est désactivée.
- Correction des échecs d’exécution enfant lorsque les données contiennent la valeur NaN et que la caractérisation est désactivée.
- AutoML génère un nouveau code d’erreur à partir de dataprep lorsque le contenu est modifié lors de la lecture.
- Mise à jour de la normalisation pour les métriques de prévision qui se produisent par grain.
- Amélioration du calcul des quantiles de prévision lorsque les fonctionnalités de recherche en arrière sont désactivées.
- Correction de la gestion des matrices éparses booléennes lors du calcul des explications après AutoML.
- azureml-core
- La nouvelle méthode
run.get_detailed_status()
affiche à présent l’explication détaillée de l’état actuel de l’exécution. Elle n’indique actuellement qu’une explication de l’étatQueued
. - Ajout des paramètres image_name et image_label à Model.package() pour permettre le changement de nom de l’image de package générée.
- Nouvelle méthode
set_pip_requirements()
permettant de définir toute la section PIP dansCondaDependencies
en une seule fois. - Activation de l’inscription du magasin de données ADLS Gen2 sans informations d’identification.
- Amélioration du message d’erreur lors de la tentative de téléchargement ou de montage d’un type incorrect de jeu de données.
- Mise à jour de l’exemple de notebook de filtrage des jeux de données de série chronologique avec d’autres exemples de partition_timestamp qui fournit l’optimisation de filtre.
- Modifiez le KIT SDK et l’interface CLI pour accepter subscriptionId, resourceGroup, workspaceName, peConnectionName en tant que paramètres au lieu d’ArmResourceId lors de la suppression d’une connexion de point de terminaison privé.
- L’élément décoratif expérimental affiche le nom de la classe pour faciliter l’identification.
- Les descriptions des ressources à l’intérieur des modèles ne sont plus générées automatiquement en fonction d’une exécution.
- La nouvelle méthode
- azureml-datadrift
- L’API create_from_model dans DataDriftDetector est marquée comme étant bientôt déconseillée.
- azureml-dataprep
- Amélioration du message d’erreur lors de la tentative de téléchargement ou de montage d’un type incorrect de jeu de données.
- azureml-pipeline-core
- Correction d’un bogue lors de la désérialisation du graphique de pipeline qui contient des jeux de données inscrits.
- azureml-pipeline-steps
- RScriptStep prend en charge RSection à partir d’azureml.core.environment.
- Suppression du paramètre passthru_automl_config de l’API publique
AutoMLStep
et conversion en paramètre interne uniquement.
- azureml-train-automl-client
- Suppression des exécutions de l’environnement managé asynchrone local d’AutoML. Toutes les exécutions locales sont exécutées dans l’environnement dans lequel l’exécution a été lancé.
- Correction des problèmes d’instantané lors de l’envoi d’exécutions AutoML sans scripts fournis par l’utilisateur.
- Correction des échecs d’exécution enfant lorsque les données contiennent nan et que l’ingénierie de caractéristiques est désactivée.
- azureml-train-automl-runtime
- AutoML génère un nouveau code d’erreur à partir de dataprep lorsque le contenu est modifié lors de la lecture.
- Correction des problèmes d’instantané lors de l’envoi d’exécutions AutoML sans scripts fournis par l’utilisateur.
- Correction des échecs d’exécution enfant lorsque les données contiennent nan et que l’ingénierie de caractéristiques est désactivée.
- azureml-train-core
- Ajout de la prise en charge de la spécification des options PIP (par exemple, --extra-index-url) dans le fichier de spécifications PIP transmis à un
Estimator
par le biais du paramètrepip_requirements_file
.
- Ajout de la prise en charge de la spécification des options PIP (par exemple, --extra-index-url) dans le fichier de spécifications PIP transmis à un
- azure-cli-ml
03-08-2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.11.0
- Résolutions de bogue et améliorations
- azure-cli-ml
- Correction de l’infrastructure de modèle et infrastructure du modèle non passée dans l’objet d’exécution dans le chemin d’inscription du modèle CLI
- Correction de la commande d’affichage d’identité amlcompute de l’interface CLI pour afficher l’ID de locataire et l’ID de principal
- azureml-train-automl-client
- Ajout de get_best_child() à AutoMLRun pour extraire la meilleure exécution d’enfant pour une exécution d’AutoML sans télécharger le modèle associé.
- Ajout de l’objet ModelProxy ajouté qui autorise l’exécution de prédictions ou de prévisions sur un environnement de formation à distance sans télécharger le modèle localement.
- Les exceptions non gérées dans AutoML pointent désormais vers une page HTTP de problèmes connus, contenant des informations supplémentaires sur les erreurs.
- azureml-core
- Les noms de modèles peuvent compter 255 caractères.
- Modification du type d’objet de retour Environment.get_image_details(). La classe
DockerImageDetails
a remplacédict
, les détails de l’image sont disponibles dans les propriétés de la nouvelle classe. Les modifications sont à compatibilité descendante. - Correction de bogue pour Environment.from_pip_requirements() afin de conserver la structure des dépendances
- Correction d’un bogue où log_list échouait si un int et double étaient inclus dans la même liste.
- Lorsque vous activez la liaison privée sur un espace de travail existant, notez que, si des cibles de calcul sont associées à l’espace de travail, elles ne fonctionneront pas si elles ne se trouvent pas derrière le même réseau virtuel que le point de terminaison privé de l’espace de travail.
as_named_input
rendu facultatif lors de l’utilisation de jeux de données dans des expériences et ajout deas_mount
etas_download
àFileDataset
. Le nom d’entrée est généré automatiquement en cas d’appel deas_mount
ouas_download
.
- azureml-automl-core
- Les exceptions non gérées dans AutoML pointent désormais vers une page HTTP de problèmes connus, contenant des informations supplémentaires sur les erreurs.
- Ajout de get_best_child() à AutoMLRun pour extraire la meilleure exécution d’enfant pour une exécution d’AutoML sans télécharger le modèle associé.
- Ajout de l’objet ModelProxy ajouté qui autorise l’exécution de prédictions ou de prévisions sur un environnement de formation à distance sans télécharger le modèle localement.
- azureml-pipeline-steps
- Ajout des indicateurs
enable_default_model_output
etenable_default_metrics_output
àAutoMLStep
. Ces indicateurs permettent d’activer/désactiver les sorties par défaut.
- Ajout des indicateurs
- azure-cli-ml
20-07-2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.10.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Lors de l’utilisation de AutoML, si un chemin est passé à l’objet AutoMLConfig et qu’il n’existe pas déjà, il est automatiquement créé.
- Les utilisateurs peuvent désormais spécifier une fréquence de série chronologique pour les tâches de prévision à l’aide du paramètre
freq
.
- azureml-automl-runtime
- Lors de l’utilisation de AutoML, si un chemin est passé à l’objet AutoMLConfig et qu’il n’existe pas déjà, il est automatiquement créé.
- Les utilisateurs peuvent désormais spécifier une fréquence de série chronologique pour les tâches de prévision à l’aide du paramètre
freq
. - Les prévisions d’AutoML prennent désormais en charge la propagation d’évaluation qui s’applique quand la longueur d’un jeu de test ou de validation dépasse l’horizon d’entrée, et que la valeur y_pred connue est utilisée comme contexte de prévision.
- azureml-core
- Des messages d’avertissement sont imprimés si aucun fichier n’a été téléchargé à partir du magasin de données dans une exécution.
- Ajout de documentation pour
skip_validation
à laDatastore.register_azure_sql_database method
. - Les utilisateurs doivent effectuer une mise à niveau vers le Kit de développement logiciel (SDK) v1.10.0 ou version ultérieure pour créer un point de terminaison privé approuvé automatiquement. Cela inclut la ressource Blocs-notes utilisable derrière le réseau virtuel.
- Exposer NotebookInfo dans la réponse à la commande Obtenir l’espace de travail.
- Modifications apportées pour que les appels répertorient les cibles de calcul et que l’obtention de la cible de calcul réussisse sur une exécution à distance. Les fonctions sdk pour obtenir les cibles de calcul cible de calcul et lister les cibles de calcul de l’espace de travail fonctionnent désormais dans les exécutions à distance.
- Ajout de messages de dépréciation aux descriptions de classe pour les classes azureml.core.image.
- Levée d’exception et nettoyage d’espace de travail et de ressources dépendantes si la création de point de terminaison privé d’espace de travail échoue.
- Prise en charge de la mise à niveau de référence (SKU) d’espace de travail dans la méthode de mise à jour d’espace de travail.
- azureml-datadrift
- Mise à jour de la version de matplotlib de 3.0.2 à 3.2.1 pour prendre en charge Python 3.8.
- azureml-dataprep
- Ajout de la prise en charge de sources de données URL web avec une demande
Range
ouHead
. - Amélioration de la stabilité améliorée pour le montage et le téléchargement de jeux de données de fichiers.
- Ajout de la prise en charge de sources de données URL web avec une demande
- azureml-train-automl-client
- Résolution des problèmes liés à la suppression de
RequirementParseError
de setuptools. - Utilisation de Docker au lieu de Conda pour les exécutions locales soumises à l’aide de « compute_target=’local’ »
- Correction de la durée d’itération imprimée sur la console. Auparavant, la durée de l’itération était parfois imprimée comme heure de fin d’exécution moins l’heure de création de l’exécution. Elle a été corrigée en heure de fin d’exécution moins l’heure de début de l’exécution.
- Lors de l’utilisation de AutoML, si un chemin est passé à l’objet AutoMLConfig et qu’il n’existe pas déjà, il est automatiquement créé.
- Les utilisateurs peuvent désormais spécifier une fréquence de série chronologique pour les tâches de prévision à l’aide du paramètre
freq
.
- Résolution des problèmes liés à la suppression de
- azureml-train-automl-runtime
- Amélioration de la sortie de la console lorsque les meilleures explications du modèle échouent.
- Le paramètre d’entrée a été renommé en « blocked_models » pour supprimer un terme sensible.
- Le paramètre d’entrée a été renommé en « allowed_models » pour supprimer un terme sensible.
- Les utilisateurs peuvent désormais spécifier une fréquence de série chronologique pour les tâches de prévision à l’aide du paramètre
freq
.
- azureml-automl-core
2020-07-06
Kit SDK Azure Machine Learning pour Python v1.9.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Remplacement de get_model_path() par la variable d'environnement AZUREML_MODEL_DIR dans le script de scoring généré automatiquement par AutoML. Ajout des données de télémétrie pour suivre les défaillances lors d’init().
- Suppression de la possibilité de spécifier
enable_cache
dans le cadre d’AutoMLConfig - Correction d’un bogue où les exécutions pouvaient échouer avec des erreurs de service pendant des exécutions de prévisions spécifiques
- Amélioration de la gestion des erreurs pour des modèles spécifiques pendant
get_output
- Correction de l’appel à fitted_model.fit(X, y) pour la classification avec le transformateur y
- Activation de l’imputation de remplissage prédictif personnalisée pour les tâches de prévision
- Une nouvelle classe ForecastingParameters est utilisée à la place des paramètres de prévision dans un format dict
- Détection automatique du retard de la cible améliorée
- Ajout d’une disponibilité limitée de caractérisation à plusieurs nœuds distribuée sur plusieurs GPU avec BERT
- azureml-automl-runtime
- Prophet effectue désormais une modélisation saisonnière additive plutôt que multiplicative.
- Résolution du problème lorsque les grains courts, avec des fréquences différentes de celles des grains longs, entraînent des échecs d’exécution.
- azureml-contrib-automl-dnn-vision
- Collecter les statistiques système/GPU et les moyennes des journaux pour l’apprentissage et le scoring
- azureml-contrib-mir
- Ajout de la prise en charge de l’indicateur enable-app-insights dans ManagedInferencing
- azureml-core
- Un paramètre de validation pour ces API en permettant d’ignorer la validation lorsque la source de données n’est pas accessible depuis le calcul actuel.
- TabularDataset.time_before(end_time, include_boundary=True, validate=True)
- TabularDataset.time_after(start_time, include_boundary=True, validate=True)
- TabularDataset.time_recent(time_delta, include_boundary=True, validate=True)
- TabularDataset.time_between(start_time, end_time, include_boundary=True, validate=True)
- Ajout de la prise en charge du filtrage des frameworks pour la liste de modèles et ajout de l’exemple NCD AutoML dans le bloc-notes
- Pour Datastore.register_azure_blob_container et Datastore.register_azure_file_share (les seules les options qui prennent en charge le jeton SAS), nous avons mis à jour les chaînes de documentation du champ
sas_token
pour inclure les exigences d’autorisation minimales pour les scénarios de lecture et d’écriture typiques. - Dépréciation du paramètre _with_auth dans ws.get_mlflow_tracking_uri()
- Un paramètre de validation pour ces API en permettant d’ignorer la validation lorsque la source de données n’est pas accessible depuis le calcul actuel.
- azureml-mlflow
- Ajout de la prise en charge du déploiement de modèles file:// locaux avec AzureML-MLflow
- Dépréciation du paramètre _with_auth dans ws.get_mlflow_tracking_uri()
- azureml-opendatasets
- Les jeux de données de suivi du COVID-19 récemment publiés sont désormais disponibles avec le kit de développement logiciel (SDK)
- azureml-pipeline-core
- Avertissement de déconnexion lorsque « azureml-defaults » n’est pas inclus dans le cadre de pip-dependency
- Amélioration du rendu des notes.
- Ajout de la prise en charge des sauts de ligne entre guillemets lors de l’analyse des fichiers délimités dans PipelineOutputFileDataset.
- La classe PipelineDataset est déconseillée. Pour plus d’informations, consultez https://aka.ms/dataset-deprecation. Découvrez comment utiliser le jeu de données avec le pipeline ; consultez https://aka.ms/pipeline-with-dataset.
- azureml-pipeline-steps
- Mises à jour de la documentation pour azureml-pipeline-steps.
- Ajout de la possibilité dans le
load_yaml()
de ParallelRunConfig pour les utilisateurs de définir des environnements inlined avec le reste de la configuration ou dans un fichier distinct
- azureml-train-automl-client.
- Suppression de la possibilité de spécifier
enable_cache
dans le cadre d’AutoMLConfig
- Suppression de la possibilité de spécifier
- azureml-train-automl-runtime
- Ajout d’une disponibilité limitée de caractérisation à plusieurs nœuds distribuée sur plusieurs GPU avec BERT.
- Ajout de la gestion des erreurs pour les packages incompatibles dans les exécutions de Machine Learning automatisée basées sur ADB.
- azureml-widgets
- Mises à jour de la documentation pour azureml-widgets.
- azureml-automl-core
2020-06-22
Kit SDK Azure Machine Learning pour Python v1.8.0
Fonctionnalités préliminaires
- azureml-contrib-fairness Le package
azureml-contrib-fairness
offre une intégration entre l’évaluation d’équité open source et le package d’atténuation du manque d’équité Fairlearn et Azure Machine Learning Studio. En particulier, le package permet de charger des tableaux de bord d’évaluation d’impartialité du modèle dans le cadre d’une exécution Azure Machine Learning et de les afficher dans Azure Machine Learning studio
- azureml-contrib-fairness Le package
Résolutions de bogue et améliorations
- azure-cli-ml
- Prise en charge de l’obtention des journaux du conteneur init.
- Ajout de nouvelles commandes CLI pour gérer ComputeInstance
- azureml-automl-core
- Les utilisateurs peuvent à présent activer l’itération d’ensemble d’empilement pour les tâches de série chronologique avec un avertissement indiquant qu’un dépassement est possible.
- Ajout d’un nouveau type d’exception utilisateur qui est déclenché si le contenu du magasin de cache a été falsifié
- azureml-automl-runtime
- Le balayage d’équilibrage de classe n’est plus activé si l’utilisateur désactive la caractérisation.
- azureml-contrib-notebook
- Améliorations apportées à la documentation du package azureml-contrib-notebook.
- azureml-contrib-pipeline-steps
- Améliorations apportées à la documentation du package azureml-contrib--pipeline-steps.
- azureml-core
- Ajout des fonctions set_connection, get_connection, list_connections et delete_connection pour que le client opère sur la ressource de connexion de l’espace de travail
- Mises à jour de la documentation du package zureml-coore/azureml.exceptions.
- Mises à jour de la documentation du package azureml-core.
- Mises à jour de la documentation de la classe ComputeInstance.
- Améliorations à la documentation du package azureml-core/azureml.core.compute.
- Améliorations à la documentation des classes liées à webservice dans azureml-core.
- Prise en charge du magasin de données sélectionné par l’utilisateur pour stocker les données de profilage
- Ajout des propriétés expand et page_count pour l’API de liste de modèles
- Correction du bogue dans lequel la suppression de la propriété Overwrite entraîne l’échec de l’exécution envoyée avec une erreur de désérialisation.
- Correction de la structure de dossiers incohérente lors du téléchargement ou du montage d’un FileDataset référençant un seul fichier.
- Le chargement d’un jeu de données de fichiers parquet sur to_spark_dataframe est désormais plus rapide et prend en charge tous les types de données SQL parquet et Spark.
- Prise en charge de l’obtention des journaux du conteneur init.
- Les exécutions AutoML sont désormais marquées comme étant des exécutions enfants de l’étape d’exécution parallèle.
- azureml-datadrift
- Améliorations apportées à la documentation du package azureml-contrib-notebook.
- azureml-dataprep
- Le chargement d’un jeu de données de fichiers parquet sur to_spark_dataframe est désormais plus rapide et prend en charge tous les types de données SQL parquet et Spark.
- Meilleure gestion de la mémoire en cas de problème OutOfMemory pour to_pandas_dataframe.
- azureml-interpret
- Mise à niveau d'azureml-interpret pour utiliser interpret-community version 0.12.*
- azureml-mlflow
- Améliorations apportées à la documentation de azureml-mlflow.
- Ajout de la prise en charge du registre de modèle AML avec MLFlow.
- azureml-opendatasets
- Ajout de la prise en charge de Python 3.8
- azureml-pipeline-core
- Mise à jour de la documentation de
PipelineDataset
pour clarifier qu’il s’agit d’une classe interne. - Mises à jour à ParallelRunStep pour accepter plusieurs valeurs pour un argument, par exemple : « --group_column_names », « col1 », « col2 », « col3 »
- Suppression de l’exigence passthru_automl_config pour l’utilisation des données intermédiaires avec AutoMLStep dans les pipelines.
- Mise à jour de la documentation de
- azureml-pipeline-steps
- Améliorations apportées à la documentation du package azureml-pipeline-steps.
- Suppression de l’exigence passthru_automl_config pour l’utilisation des données intermédiaires avec AutoMLStep dans les pipelines.
- azureml-telemetry
- Améliorations apportées à la documentation de azureml-telemetry.
- azureml-train-automl-client
- Correction d’un bogue à cause duquel
experiment.submit()
appelait deux fois sur un objetAutoMLConfig
avec un comportement différent. - Les utilisateurs peuvent maintenant activer l’itération d’ensemble d’empilement pour les tâches de séries chronologiques avec un avertissement indiquant qu’un dépassement est possible.
- Modification du comportement d’exécution d’AutoML pour déclencher UserErrorException si le service lève une erreur utilisateur
- Résout un bogue à cause duquel azureml_automl.log n’était pas généré ou ne contenait pas les journaux lors de l’exécution d’une expérience AutoML sur une cible de calcul à distance.
- Pour les jeux de données de classification avec des classes déséquilibrées, nous appliquons l’équilibrage de poids ; si le nettoyeur de fonctionnalités détermine un déséquilibre pour les données sous-échantillonnées, l’équilibrage de poids améliore les performances de la tâche de classification d’un certain seuil.
- Les exécutions AutoML sont désormais marquées comme étant des exécutions enfants de l’étape d’exécution parallèle.
- Correction d’un bogue à cause duquel
- azureml-train-automl-runtime
- Modification du comportement d’exécution d’AutoML pour déclencher UserErrorException si le service lève une erreur utilisateur
- Les exécutions AutoML sont désormais marquées comme étant des exécutions enfants de l’étape d’exécution parallèle.
- azure-cli-ml
2020-06-08
Kit SDK Azure Machine Learning pour Python v1.7.0
- Résolutions de bogue et améliorations
- azure-cli-ml
- Suppression du profilage de modèle de la contribution Mir en nettoyant les commandes CLI et les dépendances de package ; le profilage de modèle est disponible dans core.
- Mise à niveau de la version minimale de l’interface Azure CLI vers 2.3.0
- azureml-automl-core
- Message d’exception plus clair à l’étape de caractérisation fit_transform() en raison de paramètres de transformateur personnalisés.
- Ajoutez la prise de plusieurs langages pour les modèles de transformateur de Deep Learning tels que BERT dans le Machine Learning automatisé.
- Suppression du paramètre lag_length déconseillé de la documentation.
- La documentation sur les paramètres de prévision a été améliorée. Le paramètre lag_length a été déconseillé.
- azureml-automl-runtime
- Correction de l’erreur déclenchée lorsque l’une des colonnes catégoriques est vide dans l’heure de prévision/test.
- Résolution des échecs d’exécution lorsque les fonctionnalités lookback sont activées et que les données contiennent des grains courts.
- Correction du problème lié à un message d’erreur d’index de temps dupliqué lorsque les retards ou fenêtres dynamiques étaient définis sur « auto ».
- Correction du problème avec les modèles Prophet et ARIMA sur les jeux de données contenant les fonctionnalités lookback.
- Ajout de la prise en charge des dates antérieures à 1677-09-21 et ultérieures à 2262-04-11 dans les colonnes autres que la date et l’heure dans les tâches de prévision. Amélioration des messages d’erreur.
- La documentation sur les paramètres de prévision a été améliorée. Le paramètre lag_length a été déconseillé.
- Message d’exception plus clair à l’étape de caractérisation fit_transform() en raison de paramètres de transformateur personnalisés.
- Ajoutez la prise de plusieurs langages pour les modèles de transformateur de Deep Learning tels que BERT dans le Machine Learning automatisé.
- Les opérations de cache qui aboutissent à des OSErrors génèrent une erreur utilisateur.
- Ajout de vérifications pour s’assurer que les données de formation et de validation ont le même nombre et le même ensemble de colonnes
- Correction du problème avec le script de notation AutoML généré automatiquement lorsque les données contiennent des guillemets
- Activation d’explications pour AutoML Prophet et les modèles d’ensemble qui contiennent le modèle Prophet.
- Un problème client récent a révélé un bogue de site dans lequel nous consignions les messages dans le cadre de l’équilibrage des classes, même lorsque la logique d’équilibrage de classe n’était pas correctement activée. Suppression de ces journaux/messages avec cette demande de tirage.
- azureml-cli-common
- Terminé la suppression du profilage de modèle à partir de mir contrib en supprimant les commandes CLI et les dépendances de package. Le profilage de modèle est disponible en cœur.
- azureml-contrib-reinforcementlearning
- Outil de test de charge
- azureml-core
- Modifications apportées à la documentation de Script_run_config.py
- Résolution d’un bogue avec l’impression de la sortie de la ligne de commande submit-pipeline
- Améliorations de la documentation pour azureml-core/azureml.data
- Corrige le problème lors de la récupération du compte de stockage à l’aide de la commande hdfs getconf
- Amélioration de la documentation pour register_azure_blob_container et register_azure_file_share
- azureml-datadrift
- Amélioration de l’implémentation pour la désactivation et l’activation des superviseurs de dérive de données
- azureml-interpret
- Dans le client d’explication, suppression des valeurs NaN ou Infs avant la sérialisation JSON lors du chargement à partir des artefacts
- Mise à jour vers la dernière version d’interpret-community pour améliorer les erreurs de mémoire insuffisante pour les explications globales avec de nombreuses fonctionnalités et classes
- Ajout du paramètre facultatif true_ys au chargement d’explications pour activer plus de fonctionnalités dans l’interface utilisateur de Studio
- Amélioration des performances de download_model_explanations() et list_model_explanations()
- Petites modifications apportées aux blocs-notes, pour faciliter le débogage
- azureml-opendatasets
- azureml-opendatasets nécessite azureml-dataprep version 1.4.0 ou ultérieure. Ajout d’un avertissement si une version inférieure est détectée
- azureml-pipeline-core
- Cette modification permet à l’utilisateur de fournir un runconfig facultatif à moduleVersion lors de l’appel à module.Publish_python_script.
- Le compte de nœud peut être un paramètre de pipeline dans ParallelRunStep dans azureml.pipeline.steps
- azureml-pipeline-steps
- Cette modification permet à l’utilisateur de fournir un runconfig facultatif à moduleVersion lors de l’appel à module.Publish_python_script.
- azureml-train-automl-client
- Ajoutez la prise de plusieurs langages pour les modèles de transformateur de Deep Learning tels que BERT dans le Machine Learning automatisé.
- Suppression du paramètre lag_length déconseillé de la documentation.
- La documentation sur les paramètres de prévision a été améliorée. Le paramètre lag_length a été déconseillé.
- azureml-train-automl-runtime
- Activation d’explications pour AutoML Prophet et les modèles d’ensemble qui contiennent le modèle Prophet.
- Mises à jour de la documentation des packages azureml-train-automl-*.
- azureml-train-core
- Prise en charge de la version 2.1 de TensorFlow dans l’estimateur PyTorch
- Améliorations apportées au package azureml-train-core.
- azure-cli-ml
2020-05-26
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.6.0
Nouvelles fonctionnalités
azureml-automl-runtime
- La prévision AutoML prend désormais en charge la prévision des clients au-delà de l’horizon maximal spécifié en amont, sans nouvel apprentissage du modèle. Lorsque la destination de la prévision se situe au-delà de l’horizon maximal spécifié, la fonction de forecast() continue d’effectuer des prédictions de points à la date ultérieure à l’aide d’un mode d’opération récursif. Pour une illustration de la nouvelle fonctionnalité, consultez la section « Prévision au-delà de l’horizon maximal » du notebook « forecasting-forecast-function » dans le dossier.
azureml-pipeline-steps
- Désormais publié, ParallelRunStep fait partie du package azureml-pipeline-steps. La version de ParallelRunStep présente dans azureml-contrib-pipeline-steps est déconseillée. Modifications par rapport à la préversion publique :
- Ajout d'un paramètre
run_max_try
configurable facultatif pour contrôler le nombre maximal d’appels visant à exécuter la méthode pour un lot donné ; la valeur par défaut est 3. - Aucun PipelineParameters n’est plus généré automatiquement. Les valeurs configurables suivantes peuvent être définies comme PipelineParameter de manière explicite.
- mini_batch_size
- node_count
- process_count_per_node
- Niveau de journalisation
- run_invocation_timeout
- run_max_try
- La valeur par défaut de process_count_per_node est désormais 1. L’utilisateur doit ajuster cette valeur pour obtenir de meilleures performances. La meilleure pratique consiste à opter pour nombre de GPU ou d’UC dont dispose un nœud.
- ParallelRunStep n’injecte aucun package, l’utilisateur doit inclure des packages azureml-core et azureml-dataprep [pandas, fuse] dans la définition de l’environnement. Si l’image Docker personnalisée est utilisée avec user_managed_dependencies, l’utilisateur doit installer Conda sur l’image.
- Ajout d'un paramètre
- Désormais publié, ParallelRunStep fait partie du package azureml-pipeline-steps. La version de ParallelRunStep présente dans azureml-contrib-pipeline-steps est déconseillée. Modifications par rapport à la préversion publique :
Dernières modifications
- azureml-pipeline-steps
- Utilisation d’azureml.dprep.Dataflow déconseillée comme type d’entrée valide pour AutoMLConfig
- azureml-train-automl-client
- Utilisation d’azureml.dprep.Dataflow déconseillée comme type d’entrée valide pour AutoMLConfig
- azureml-pipeline-steps
Résolutions de bogue et améliorations
- azureml-automl-core
- Correction du bogue à cause duquel un avertissement pouvait être imprimé pendant
get_output
qui demandait à l’utilisateur de passer à une version antérieure du client. - Mac mis à jour pour utiliser cudatoolkit= 9.0 car il n’est pas encore disponible dans la version 10.
- Suppression des restrictions sur les modèles phrophet et xgboost lorsqu’ils sont entraînés sur un cacul distant.
- Amélioration de la journalisation dans AutoML
- La gestion des erreurs liées à la caractérisation personnalisée dans les tâches de prévision a été améliorée.
- Ajout d’une fonctionnalité permettant aux utilisateurs d’inclure des fonctions décalées pour générer des prévisions.
- Mise à jour du message d’erreur afin d’afficher correctement l’erreur de l’utilisateur.
- Prise en charge de cv_split_column_names à utiliser avec training_data
- Mise à jour de la journalisation du message d’exception et traceback.
- Correction du bogue à cause duquel un avertissement pouvait être imprimé pendant
- azureml-automl-runtime
- Activez des garde-fous pour prévoir les imputations de valeurs manquantes.
- Amélioration de la journalisation dans AutoML
- Ajout d’une gestion des erreurs affinée pour les exceptions liées à la préparation des données
- Suppression des restrictions sur les modèles phrophet et xgboost lorsqu’ils sont entraînés sur un cacul distant.
azureml-train-automl-runtime
etazureml-automl-runtime
ont mis à jour des dépendances pourpytorch
,scipy
etcudatoolkit
. Nous prenons désormais en chargepytorch==1.4.0
,scipy>=1.0.0,<=1.3.1
etcudatoolkit==10.1.243
.- La gestion des erreurs liées à la caractérisation personnalisée dans les tâches de prévision a été améliorée.
- Le mécanisme de détection de la fréquence du jeu de données de prévision a été amélioré.
- Correction d’un problème lié à l’apprentissage du modèle Prophet sur certains jeux de données.
- La détection automatique de l’horizon maximum lors de la prévision a été améliorée.
- Ajout d’une fonctionnalité permettant aux utilisateurs d’inclure des fonctions décalées pour générer des prévisions.
- Ajoute des fonctionnalités à la fonction de prévision pour permettre des prévisions au-delà de l’horizon formé, sans nouvelle apprentissage du modèle de prévision.
- Prise en charge de cv_split_column_names à utiliser avec training_data
- azureml-contrib-automl-dnn-forecasting
- Amélioration de la journalisation dans AutoML
- azureml-contrib-mir
- Ajout d’une prise en charge des services Windows dans ManagedInferencing
- Suppression des anciens workflows MIR comme celui consistant à attacher le calcul MIR, la classe SingleModelMirWebservice - Profilage du modèle de nettoyage placé dans le package contrib-mir
- azureml-contrib-pipeline-steps
- Correctif mineur pour la prise en charge YAML
- ParallelRunStep est publié en disponibilité générale - azureml.contrib.pipeline.steps comporte un avis de désapprobation et est déplacé vers azureml.pipeline.steps
- azureml-contrib-reinforcementlearning
- Outil de test de charge RL
- L’estimateur RL propose des valeurs par défaut intelligentes
- azureml-core
- Suppression des anciens workflows MIR comme celui consistant à attacher le calcul MIR, la classe SingleModelMirWebservice - Profilage du modèle de nettoyage placé dans le package contrib-mir
- Correction des informations fournies à l’utilisateur dans l’échec du profilage : ID de requête inclus et reformulation du message pour qu’il soit plus explicite. Ajout d’un nouveau workflow de profilage aux exécuteurs de profilage
- Amélioration du texte d’erreur dans les échecs d’exécution d’un jeu de données.
- Ajout d’une prise en charge CLI de liaison privée d’espace de travail.
- Ajout d’un paramètre facultatif
invalid_lines
àDataset.Tabular.from_json_lines_files
permettant de spécifier la manière de gérer les lignes contenant un JSON non valide. - Nous déconseillerons la création basée sur l’exécution d’un calcul dans la prochaine version. Nous vous recommandons de créer un cluster Amlcompute réel en tant que cible de calcul persistante et d’utiliser le nom du cluster en tant que cible de calcul dans votre configuration d’exécution. Voir l’exemple de notebook disponible ici : aka.ms/amlcomputenb
- Amélioration des messages d’erreur dans les échecs d’exécution d’un jeu de données.
- azureml-dataprep
- Avertissement pour mettre à niveau la version pyarrow de manière plus explicite.
- Amélioration de la gestion des erreurs et du message retourné dans l’échec d’exécution du flux de données.
- azureml-interpret
- Mises à jour de la documentation du package azureml-interpret.
- Correction des packages d’interprétabilité et des notebooks à des fins de compatibilité avec la dernière mise à jour sklearn
- azureml-opendatasets
- Renvoie None si aucune donnée n’est renvoyée.
- Amélioration des performances de to_pandas_dataframe.
- azureml-pipeline-core
- Correctif rapide pour ParallelRunStep en cas de chargement interrompu à partir de YAML
- ParallelRunStep est publié en disponibilité générale - azureml.contrib.pipeline.steps comporte un avis de désapprobation et est déplacé vers azureml.pipeline.steps - nouvelles fonctionnalités incluant : 1. Jeux de données en tant que PipelineParameter 2. Nouveau paramètre run_max_retry 3. Nom du fichier de sortie append_row configurable
- azureml-pipeline-steps
- azureml.dprep.Dataflow désormais déconseillé en tant que type valide pour les données d'entrée.
- Correctif rapide pour ParallelRunStep en cas de chargement interrompu à partir de YAML
- ParallelRunStep est publié en disponibilité générale - azureml.contrib.pipeline.steps comporte un avis de désapprobation et est déplacé vers azureml.pipeline.steps - nouvelles fonctionnalités incluant :
- Jeux de données en tant que PipelineParameter
- Nouveau paramètre run_max_retry
- Nom du fichier de sortie append_row configurable
- azureml-telemetry
- Mise à jour de la journalisation du message d’exception et traceback.
- azureml-train-automl-client
- Amélioration de la journalisation dans AutoML
- Mise à jour du message d’erreur afin d’afficher correctement l’erreur de l’utilisateur.
- Prise en charge de cv_split_column_names à utiliser avec training_data
- azureml.dprep.Dataflow désormais déconseillé en tant que type valide pour les données d'entrée.
- Mac mis à jour pour utiliser cudatoolkit= 9.0 car il n’est pas encore disponible dans la version 10.
- Suppression des restrictions sur les modèles phrophet et xgboost lorsqu’ils sont entraînés sur un cacul distant.
azureml-train-automl-runtime
etazureml-automl-runtime
ont mis à jour des dépendances pourpytorch
,scipy
etcudatoolkit
. Nous prenons désormais en chargepytorch==1.4.0
,scipy>=1.0.0,<=1.3.1
etcudatoolkit==10.1.243
.- Ajout d’une fonctionnalité permettant aux utilisateurs d’inclure des fonctions décalées pour générer des prévisions.
- azureml-train-automl-runtime
- Amélioration de la journalisation dans AutoML
- Ajout d’une gestion des erreurs affinée pour les exceptions liées à la préparation des données
- Suppression des restrictions sur les modèles phrophet et xgboost lorsqu’ils sont entraînés sur un cacul distant.
azureml-train-automl-runtime
etazureml-automl-runtime
ont mis à jour des dépendances pourpytorch
,scipy
etcudatoolkit
. Nous prenons désormais en chargepytorch==1.4.0
,scipy>=1.0.0,<=1.3.1
etcudatoolkit==10.1.243
.- Mise à jour du message d’erreur afin d’afficher correctement l’erreur de l’utilisateur.
- Prise en charge de cv_split_column_names à utiliser avec training_data
- azureml-train-core
- Ajout d’un nouvel ensemble d’exceptions spécifiques à HyperDrive. azureml.train.hyperdrive lève désormais des exceptions détaillées.
- azureml-widgets
- Les widgets Azure Machine Learning ne s’affichent pas dans JupyterLab
- azureml-automl-core
2020-05-11
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.5.0
Nouvelles fonctionnalités
- Fonctionnalités préliminaires
- azureml-contrib-reinforcementlearning
- Azure Machine Learning prend en charge la version préliminaire de l’apprentissage par renforcement à l’aide de l’infrastructure Ray. Le
ReinforcementLearningEstimator
permet la formation d’agents d’apprentissage par renforcement sur les cibles de calcul de GPU et UC dans Azure Machine Learning.
- Azure Machine Learning prend en charge la version préliminaire de l’apprentissage par renforcement à l’aide de l’infrastructure Ray. Le
- azureml-contrib-reinforcementlearning
- Fonctionnalités préliminaires
Résolutions de bogue et améliorations
- azure-cli-ml
- Résout un journal des avertissements laissé par inadvertance dans ma PR précédente. Le journal a été utilisé pour le débogage et a été accidentellement oublié.
- Résolution de bogue : informer les clients de l’échec partiel pendant le profilage
- azureml-automl-core
- Accélérez le modèle Prophet/AutoArima dans la prévision AutoML en activant l’ajustement parallèle pour la série chronologique lorsque les jeux de données ont plusieurs séries chronologiques. Pour tirer parti de cette nouvelle fonctionnalité, il est recommandé de définir « max_cores_per_iteration = -1 » (c’est-à-dire, à l’aide de tous les cœurs de processeur disponibles) dans AutoMLConfig.
- Corriger l’erreur de clé liée à l’impression de garde-fous dans l’interface de la console
- Correction du message d’erreur pour experimentation_timeout_hours
- Modèles TensorFlow dépréciés pour AutoML.
- azureml-automl-runtime
- Correction du message d’erreur pour experimentation_timeout_hours
- Correction de l’exception non classifiée lors de la tentative de désérialisation à partir du magasin de cache
- Accélérez le modèle Prophet/AutoArima dans la prévision AutoML en activant l’ajustement parallèle pour la série chronologique lorsque les jeux de données ont plusieurs séries chronologiques.
- Correction de la prévision avec la fenêtre dynamique activée sur les jeux de données où le test ou la prédiction défini(e) ne contient pas l’un des grains du jeu d’apprentissage.
- Amélioration de la gestion des données manquantes
- Correction du problème lié aux intervalles de prédiction lors des prévisions sur les jeux de données, contenant des séries chronologiques qui ne sont pas alignées dans le temps.
- Amélioration de la validation de la forme des données pour les tâches de prévision.
- Amélioration de la détection de fréquence.
- Création d’un meilleur message d’erreur si les plis de validation croisée pour les tâches de prévision ne peuvent pas être générés.
- Correction de l’interface de la console pour imprimer correctement le garde-fou de valeur manquante.
- Application des vérifications de type de données sur la saisie de cv_split_indices dans AutoMLConfig.
- azureml-cli-common
- Résolution de bogue : informer les clients de l’échec partiel pendant le profilage
- azureml-contrib-mir
- Ajoute une classe azureml.contrib.mir.RevisionStatus qui relaie des informations sur la révision MIR actuellement déployée et la version la plus récente spécifiée par l’utilisateur. Cette classe est incluse dans l’objet MirWebservice sous l’attribut « deployment_status ».
- Active la mise à jour sur les Webservices de type MirWebservice et sa classe enfant SingleModelMirWebservice.
- azureml-contrib-reinforcementlearning
- Ajout de la prise en charge de Ray 0.8.3
- AmlWindowsCompute prend uniquement en charge Azure Files en tant que stockage monté
- Health_check_timeout renommé en health_check_timeout_seconds
- Correction de certaines descriptions de classe/méthode.
- azureml-core
- Activation des conversions WASB -> Blob dans les clouds Azure Government et China.
- Corrige le bogue pour permettre aux rôles de lecteur d’utiliser des commandes CLI az ml run pour accéder aux informations d’exécution
- Suppression de la journalisation inutile pendant les exécutions à distance d’Azure Machine Learning avec des jeux de données d’entrée.
- RCranPackage prend désormais en charge le paramètre « version » pour la version du package CRAN.
- Résolution de bogue : informer les clients de l’échec partiel pendant le profilage
- Ajout de la gestion de virgule flottante de style européen pour azureml-core.
- Fonctionnalités de liaison privée de l’espace de travail activées dans le Kit de développement logiciel (SDK) Azure Machine Learning.
- Lorsque vous créez un TabularDataset à l’aide de
from_delimited_files
, vous pouvez spécifier si les valeurs vides doivent être chargées en tant que None ou en tant que chaîne vide en définissant l’argument booléenempty_as_string
. - Ajout de la gestion de virgule flottante de style européen pour les jeux de données.
- Amélioration des messages d’erreur sur les échecs de montage du jeu de données.
- azureml-datadrift
- La requête de résultats de dérive de données du Kit de développement logiciel présentait un bogue lors duquel aucune distinction n’était opérée entre les métriques de fonctionnalités minimales, maximales et moyennes, entraînant ainsi des valeurs en double. Nous avons résolu ce bogue en faisant précéder la cible ou la ligne de base des noms de mesures. Avant: min, max, mean en double. Après : target_min, target_max, target_mean, baseline_min, baseline_max, baseline_mean.
- azureml-dataprep
- Amélioration de la gestion des environnements Python restreints en écriture lorsque vous garantissez les dépendances .NET nécessaires pour la livraison des données.
- Correction de la création de dataflow sur le fichier avec des enregistrements vides de début.
- Ajout d’options de gestion des erreurs pour
to_partition_iterator
similaires àto_pandas_dataframe
.
- azureml-interpret
- Réduction des limites de longueur de chemin d’accès pour réduire la probabilité de dépasser la limite de Windows
- Correction de bogue pour les explications éparses créées avec l’explicatif d’imitation à l’aide d’un modèle de substitution linéaire.
- azureml-opendatasets
- Résolution du problème des colonnes de MNIST analysées sous la forme d’une chaîne qui doit être une valeur entière.
- azureml-pipeline-core
- Autorisation de l’option regenerate_outputs lors de l’utilisation d’un module incorporé dans un ModuleStep.
- azureml-train-automl-client
- Modèles TensorFlow dépréciés pour AutoML.
- Correction des algorithmes non pris en charge de liste verte d’utilisateurs en mode local
- Corrections de la documentation dans AutoMLConfig.
- Application des vérifications de type de données sur la saisie de cv_split_indices dans AutoMLConfig.
- Correction du problème lié à l’échec de l’exécution d’AutoML dans show_output
- azureml-train-automl-runtime
- Correction d’un bogue dans les itérations Ensemble qui empêchait le délai de téléchargement du modèle de s’exécuter correctement.
- azureml-train-core
- Correction d’une faute de frappe dans la classe azureml.train.dnn.Nccl.
- Prise en charge de la version 1.5 de PyTorch dans l’estimateur PyTorch
- Correction du problème où l’image de l’infrastructure ne pouvait pas être extraite dans la région Azure Government lors de l’utilisation des estimateurs d’infrastructure de formation
- azure-cli-ml
2020-05-04
Nouvelle expérience de Notebook
Vous pouvez désormais créer, modifier et partager des notebooks et des fichiers de Machine Learning directement dans l’expérience Web Studio de Azure Machine Learning. Vous pouvez utiliser toutes les classes et méthodes disponibles dans le SDK Python Azure Machine Learning de l’intérieur de ces notebooks. Pour commencer, consultez l’article Exécuter des notebooks Jupyter dans votre espace de travail.
Nouvelles fonctionnalités introduites :
- Éditeur amélioré (éditeur Monaco) utilisé par Visual Studio Code
- Améliorations UI/UX
- Barre d'outils de cellules
- Nouvelle barre d’outils du notebook et contrôles de calcul
- Barre d’états du notebook
- Basculement de noyau inclus
- Support R
- Améliorations de l’accessibilité et de la localisation
- Palette de commandes
- Raccourcis clavier supplémentaires
- Enregistrement automatique
- Amélioration de la fiabilité et des performances
Accédez aux outils de création web suivants à partir de Studio :
Outil basé sur le web | Description |
---|---|
Notebooks Azure Machine Learning studio | Première création « in-class » pour les fichiers de notebook et prise en charge de toutes les opérations disponibles dans le SDK Python Azure Machine Learning. |
2020-04-27
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.4.0
Nouvelles fonctionnalités
- Les clusters AmlCompute prennent désormais en charge la configuration d’une identité managée sur le cluster au moment de l’approvisionnement. Il vous suffit de spécifier si vous souhaitez utiliser une identité affectée par le système ou une identité affectée par l’utilisateur, et de fournir un identityId dans ce dernier cas. Vous pouvez ensuite configurer les autorisations d’accès à diverses ressources, telles que Stockage ou ACR, de manière à ce que l’identité du calcul soit utilisée pour accéder en toute sécurité aux données, au lieu de l’approche basée sur les jetons qu’AmlCompute utilise aujourd’hui. Pour plus d’informations sur les paramètres, consultez notre documentation de référence sur le Kit de développement logiciel (SDK).
Dernières modifications
- Les clusters AmlCompute prenaient en charge une fonctionnalité d’évaluation autour de la création basée sur l’exécution, que nous prévoyons de déprécier dans deux semaines. Vous pouvez continuer à créer des cibles de calcul persistantes, comme toujours, à l’aide de la classe Amlcompute, mais l’approche spécifique consistant à spécifier l’identificateur « amlcompute » en tant que cible de calcul dans la configuration de l’exécution ne sera pas prise en charge prochainement.
Résolutions de bogue et améliorations
- azureml-automl-runtime
- Active la prise en charge du type non hachable lors du calcul du nombre de valeurs uniques dans une colonne.
- azureml-core
- Amélioration de la stabilité lors de la lecture à partir de Stockage Blob Azure à l’aide d’un TabularDataset.
- Amélioration de la documentation pour le paramètre
grant_workspace_msi
pourDatastore.register_azure_blob_store
. - Correction du bogue lié à
datastore.upload
lors de la prise en charge de l’argumentsrc_dir
se terminant par un/
ou un\
. - Ajout d’un message d’erreur actionnable lors d’une tentative de chargement vers un magasin de données Stockage Blob Azure qui ne dispose pas d’une clé d’accès ou d’un jeton SAS.
- azureml-interpret
- Ajout d’une limite supérieure à la taille de fichier pour les données de visualisation sur les explications chargées.
- azureml-train-automl-client
- Vérification explicite des paramètres label_column_name et weight_column_name pour qu’AutoMLConfig soit de type chaîne.
- azureml-contrib-pipeline-steps
- ParallelRunStep prend désormais en charge le jeu de données comme paramètre de pipeline. L’utilisateur peut construire un pipeline avec un exemple de jeu de données et modifier le jeu de données d’entrée du même type (fichier ou tabulaire) pour l’exécution du nouveau pipeline.
- azureml-automl-runtime
13/04/2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.3.0
- Résolutions de bogue et améliorations
- azureml-automl-core
- Ajout de télémétrie supplémentaire pour les opérations post-entraînement.
- Accélère l'apprentissage automatique ARIMA en utilisant l'apprentissage CSS (somme des carrés conditionnelle) pour les séries de longueur supérieure à 100. La longueur utilisée est stockée en tant que constante ARIMA_TRIGGER_CSS_TRAINING_LENGTH dans la classe TimeSeriesInternal sous /src/azureml-automl-core/azureml/automl/core/shared/constants.py
- La journalisation utilisateur des exécutions de prévisions a été améliorée. Le journal présente désormais davantage d'informations sur la phase en cours
- Interdiction de définir target_rolling_window_size sur une valeur inférieure à 2
- azureml-automl-runtime
- Amélioration du message d'erreur affiché lorsque des timestamps en double sont trouvés.
- Interdiction de définir target_rolling_window_size sur une valeur inférieure à 2
- Correction de l'échec d'imputation du décalage. Le problème était dû au nombre insuffisant d'observations nécessaires pour décomposer une série de façon saisonnière. Les données « désaisonnalisées » sont utilisées pour calculer une fonction d'autocorrélation partielle (PACF) afin de déterminer la longueur du décalage.
- Activation de la personnalisation de la caractérisation de l'objet des colonnes pour les tâches de prévision par la configuration de la caractérisation. Les objets de colonne Numérique et Catégorique sont maintenant pris en charge pour les tâches de prévision.
- Activation de la personnalisation de la caractérisation de la suppression des colonnes pour les tâches de prévision par la configuration de la caractérisation.
- Activation de la personnalisation de l'imputation pour les tâches de prévision par la configuration de la caractérisation. L'imputation en valeur constante pour la colonne cible et l'imputation en valeur moyenne, médiane, la plus fréquente et constante pour les données d'apprentissage sont désormais prises en charge.
- azureml-contrib-pipeline-steps
- Accepter que les noms de calcul des chaînes soient transmis à ParallelRunConfig
- azureml-core
- Ajout de l'API Environment.clone(new_name) pour créer une copie de l'objet Environment
- Environment.docker.base_dockerfile accepte le chemin d'accès aux fichiers. S’il est en mesure de résoudre un fichier, le contenu est lu dans la propriété d’environnement base_dockerfile
- Réinitialisation automatique des valeurs mutuellement exclusives pour base_image et base_dockerfile lorsque l'utilisateur définit manuellement une valeur dans Environment.docker
- Ajout dans RSection de l’indicateur user_managed qui indique si l’environnement est géré par l’utilisateur ou par Azure Machine Learning.
- Jeu de données : correction de l’échec du téléchargement du jeu de données si le chemin d’accès aux données contient des caractères Unicode.
- Jeu de données : amélioration du mécanisme de mise en cache du montage du jeu de données pour respecter l’espace disque minimum requis dans Capacité de calcul Azure Machine Learning. Le nœud reste ainsi utilisable et le travail n’est pas annulé.
- Jeu de données : Ajout d’un index pour la colonne de série chronologique lorsque vous accédez à un jeu de données de série chronologique sous la forme de dataframe Pandas, utilisé pour accélérer l’accès aux données de série chronologique. Auparavant, l'index portait le même nom que la colonne timestamp, ce qui ne permettait pas aux utilisateurs de faire la distinction entre la colonne timestamp réelle et l'index. Nous ne donnons plus de nom spécifique à l'index car il ne doit pas être utilisé en tant que colonne.
- Jeu de données : correction du problème d’authentification des jeux de données dans le cloud souverain.
- Jeu de données : correction de l’échec
Dataset.to_spark_dataframe
concernant les jeux de données créés à partir de magasins de données Azure PostgreSQL.
- azureml-interpret
- Ajout de scores globaux à la visualisation si les valeurs d'importance locale sont partiellement remplies
- Mise à jour d'azureml-interpret pour utiliser interpret-community 0.9.*
- Résolution d'un problème lié au téléchargement des explications contenant des données d'évaluation partiellement remplies
- Ajout de la prise en charge du format Partiellement rempli de l'objet d'explication dans AutoML
- azureml-pipeline-core
- Prise en charge de ComputeInstance comme cible de calcul dans les pipelines
- azureml-train-automl-client
- Ajout de télémétrie supplémentaire pour les opérations post-entraînement.
- Correction de la régression lors d'un arrêt précoce
- azureml.dprep.Dataflow désormais déconseillé en tant que type valide pour les données d'entrée.
- Délai d'expiration de l'expérience AutoML par défaut remplacé par six jours.
- azureml-train-automl-runtime
- Ajout de télémétrie supplémentaire pour les opérations post-entraînement.
- Ajout de la prise en charge de bout en bout d’AutoML
- azureml-opendatasets
- Ajout d’une autre télémétrie pour l’analyse de service.
- Activer l’instance Front Door pour les objets blob afin d'améliorer la stabilité
- azureml-automl-core
2020-03-23
Kit SDK Azure Machine Learning pour Python v1.2.0
Dernières modifications
- Arrêt de la prise en charge de Python 2.7
Résolutions de bogue et améliorations
- azure-cli-ml
- Ajoute « --subscription-ID » au commandes
az ml model/computetarget/service
dans l’interface CLI - Ajout de la prise en charge de la transmission de la clé gérée par le client (CMK) vault_url, key_name et key_version pour le déploiement ACI
- Ajoute « --subscription-ID » au commandes
- azureml-automl-core
- Activation de l’imputation personnalisée avec une valeur constante pour les tâches de prévision de données X et y.
- Résolution du problème lié à l’affichage de messages d’erreur à l’utilisateur.
- azureml-automl-runtime
- Résolution du problème lié à la prévision sur les jeux de données contenant des grains avec une seule ligne
- Réduction de la quantité de mémoire requise par les tâches de prévision.
- Ajout de meilleurs messages d’erreur si la colonne de temps a un format incorrect.
- Activation de l’imputation personnalisée avec une valeur constante pour les tâches de prévision de données X et y.
- azureml-core
- Ajout de la prise en charge du chargement de ServicePrincipal à partir de variables d’environnement : AZUREML_SERVICE_PRINCIPAL_ID, AZUREML_SERVICE_PRINCIPAL_TENANT_ID, and AZUREML_SERVICE_PRINCIPAL_PASSWORD
- Introduction d’un nouveau paramètre
support_multi_line
pourDataset.Tabular.from_delimited_files
: Par défaut (support_multi_line=False
), tous les sauts de ligne, y compris dans des valeurs de champ entre guillemets, sont interprétés comme une coupure d’enregistrement. La lecture de données de cette façon est plus rapide et plus optimisée pour une exécution en parallèle sur plusieurs cœurs de processeur. Toutefois, elle peut entraîner la production silencieuse de davantage d’enregistrements avec des valeurs de champ mal alignées. Elle doit être définie surTrue
lorsque les fichiers délimités sont connus pour contenir des sauts de ligne entre guillemets. - Ajout de la possibilité d’inscrire ADLS Gen2 dans l’interface CLI Azure Machine Learning
- Changement de nom du paramètre « fine_grain_timestamp » en « timestamp » et du paramètre « coarse_grain_timestamp » en « partition_timestamp » pour la méthode with_timestamp_columns() dans TabularDataset afin de mieux refléter l’utilisation des paramètres.
- Augmentation de la longueur maximale du nom de l’expérience à 255.
- azureml-interpret
- Mise à jour d’azureml-interpret en interpret-community 0.7.*
- azureml-sdk
- Modification des dépendances avec la version compatible Tilde pour la prise en charge des mises à jour correctives dans les versions préliminaires et les mises en production stables.
- azure-cli-ml
2020-03-11
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.1.5
Dépréciation des fonctionnalités
- Python 2.7
- Version la plus récente prenant en charge Python 2.7
- Python 2.7
Dernières modifications
- Gestion sémantique de version 2.0.0
- Depuis la version 1.1, le SDK Azure Machine Learning Python adopte Semantic Versioning 2.0.0. Toutes les versions ultérieures suivent le nouveau schéma de numérotation et le contrat de gestion sémantique de version.
- Gestion sémantique de version 2.0.0
Résolutions de bogue et améliorations
- azure-cli-ml
- Modifiez le nom de la commande CLI du point de terminaison « az ml endpoint aks » en « az ml endpoint realtime » pour garantir la cohérence.
- Mise à jour des instructions d’installation de l’interface CLI pour une branche CLI stable et expérimentale.
- Le profilage d’instance unique a été résolu pour produire une recommandation et a été rendu disponible dans le kit SDK principal.
- azureml-automl-core
- Activation de l’inférence du mode batch (prise de plusieurs lignes en une fois) pour les modèles ONNX AutoML
- Amélioration de la détection de la fréquence sur les jeux de données, des données manquantes ou contenant des points de données irréguliers
- Ajout de la possibilité de supprimer des points de données qui ne respectent pas la fréquence dominante.
- Modification de l’entrée du constructeur pour prendre une liste d’options permettant d’appliquer les options d’imputation pour les colonnes correspondantes.
- La journalisation des erreurs a été améliorée.
- azureml-automl-runtime
- Correction du problème qui provoquait la levée d’une erreur si le grain qui n’était pas présent dans le jeu d’entraînement apparaissait dans le jeu de test
- Suppression de l’exigence liée à y_query lors de la notation du service de prévision
- Correction du problème avec les prévisions lorsque le jeu de données contient des fragments réduits avec de longs laps de temps.
- Correction du problème lorsque l’horizon maximal automatique est activé et que la colonne de date contient des dates sous forme de chaînes. Des messages d’erreur et de conversion appropriés ont été ajoutés pour les cas où la conversion en date n’est pas possible.
- Utilisation de NumPy et SciPy en mode natif pour la sérialisation et la désérialisation des données intermédiaires pour FileCacheStore (utilisé pour les exécutions AutoML locales)
- Correction d’un bogue où les exécutions enfants ayant échoué pouvaient rester bloquées dans l’état d’exécution.
- Augmentation de la vitesse de caractérisation.
- Correction de la vérification de la fréquence pendant le scoring. À présent, les tâches de prévision ne nécessitent pas d’équivalence de fréquence stricte entre l’apprentissage et le jeu de tests.
- Modification de l’entrée du constructeur pour prendre une liste d’options permettant d’appliquer les options d’imputation pour les colonnes correspondantes.
- Correction des erreurs liées à la sélection du type de latence.
- Correction de l’erreur non classifiée déclenchée sur les jeux de données, où des grains se trouvent avec la ligne unique.
- Résolution du problème de lenteur lors de la détection de fréquence.
- Correction d’un bogue dans la gestion des exceptions AutoML qui faisait que la véritable raison de l’échec de la formation était remplacée par un AttributeError.
- azureml-cli-common
- Le profilage d’instance unique a été résolu pour produire une recommandation et a été rendu disponible dans le kit SDK principal.
- azureml-contrib-mir
- Ajout d’une fonctionnalités dans la classe MirWebservice pour récupérer le jeton d’accès
- Utilisez l’authentification par jeton pour MirWebservice par défaut pendant MirWebservice.run() call ; actualisez uniquement si l’appel échoue.
- Le déploiement du service web Mir requiert désormais les références SKU appropriées [Standard_DS2_v2, Standard_F16 et Standard_A2_v2] au lieu des références [Ds2v2, A2v2 et F16], respectivement.
- azureml-contrib-pipeline-steps
- Paramètre facultatif side_inputs ajouté à ParallelRunStep. Ce paramètre peut être utilisé pour monter le dossier sur le conteneur. Les types actuellement pris en charge sont DataReference et PipelineData.
- Les paramètres passés dans ParallelRunConfig peuvent désormais être remplacés en passant des paramètres de pipeline. De nouveaux paramètres de pipeline sont pris en charge : aml_mini_batch_size, aml_error_threshold, aml_logging_level, aml_run_invocation_timeout (aml_node_count et aml_process_count_per_node faisaient déjà partie de la précédente version).
- azureml-core
- Les services web Azure Machine Learning déployés sont maintenant définis par défaut sur la journalisation
INFO
. Vous pouvez contrôler cela en définissant la variable d’environnementAZUREML_LOG_LEVEL
dans le service déployé. - Le Kit de développement logiciel (SDK) Python utilise le service de découverte pour utiliser le point de terminaison « api » au lieu de « pipelines ».
- Basculement vers les nouveaux itinéraires dans tous les appels du Kit de développement logiciel (SDK).
- Modification du routage des appels à ModelManagementService vers une nouvelle structure unifiée.
- La méthode de mise à jour de l’espace de travail est désormais publiquement disponible.
- Ajout du paramètre image_build_compute dans la méthode de mise à jour de l’espace de travail afin de permettre à l’utilisateur de mettre à jour le calcul pour la génération d’image.
- Ajout de messages de dépréciation à l’ancien workflow de profilage Correction des limites de mémoire et d’UC du profilage.
- Ajout de RSection dans le cadre de l’environnement pour exécuter les travaux R.
- Ajout de la validation à
Dataset.mount
pour déclencher une erreur lorsque la source du jeu de données n’est pas accessible ou ne contient pas de données. - Ajout de
--grant-workspace-msi-access
en tant que paramètre supplémentaire pour l’interface CLI de magasin de données dans l’inscription du conteneur d’objets blob Azure, ce qui vous permet d’inscrire un conteneur d’objets blob qui est situé derrière un réseau virtuel. - Le profilage d’instance unique a été résolu pour produire une recommandation et a été rendu disponible dans le kit SDK principal.
- Correction du problème dans aks.py_deploy.
- Valide l’intégrité des modèles en cours de chargement afin d’éviter les échecs de stockage en mode silencieux.
- L’utilisateur peut désormais spécifier une valeur pour la clé d’authentification lorsqu’il regénère les clés de services web.
- Correction du bogue où les lettres majuscules ne peuvent pas être utilisées comme nom d’entrée du jeu de données.
- Les services web Azure Machine Learning déployés sont maintenant définis par défaut sur la journalisation
- azureml-defaults
azureml-dataprep
est maintenant installé dans le cadre deazureml-defaults
. Il n’est plus nécessaire d’installer data prep[fuse] manuellement sur les cibles de calcul pour monter des jeux de données.
- azureml-interpret
- Mise à jour d’azureml-interpret vers interpret-community 0.6*
- Mise à jour d’azureml-interpret pour dépendre désormais d’interpret-community 0.5.0
- Ajout d’exceptions azureml-style à azureml-interpret
- Correction de la sérialisation DeepScoringExplainer pour les modèles Keras
- azureml-mlflow
- Ajout de la prise en charge des clouds souverains à azureml.mlflow
- azureml-pipeline-core
- Le notebook de scoring par lots du pipeline utilise désormais ParallelRunStep
- Correction d’un bogue entraînant une réutilisation incorrecte des résultats PythonScriptStep malgré la modification de la liste d’arguments
- Ajout de la possibilité de définir le type des colonnes lors de l’appel des méthodes parse_* sur
PipelineOutputFileDataset
- azureml-pipeline-steps
- Déplacement de
AutoMLStep
dans le packageazureml-pipeline-steps
. Dépréciation d’AutoMLStep
dansazureml-train-automl-runtime
. - Ajout d’un exemple de documentation pour le jeu de données sous la forme d’une entrée PythonScriptStep
- Déplacement de
- azureml-tensorboard
- Mise à jour d’azureml-tensorboard pour prendre en charge TensorFlow 2.0
- Affiche le numéro de port correct lors de l’utilisation d’un port TensorBoard personnalisé sur une instance de calcul
- azureml-train-automl-client
- Résolution d’un problème où certains packages pouvaient être installés à des versions incorrectes sur des exécutions distantes.
- Correction du problème de substitution FeaturizationConfig qui filtre la configuration de caractérisation personnalisée.
- azureml-train-automl-runtime
- Résolution du problème de détection de fréquence dans les exécutions distantes
- Déplacement d’
AutoMLStep
dans le packageazureml-pipeline-steps
. Dépréciation d’AutoMLStep
dansazureml-train-automl-runtime
.
- azureml-train-core
- Prise en charge de la version 1.4 de PyTorch dans l’estimateur PyTorch
- azure-cli-ml
2020-03-02
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.1.2rc0 (préversion)
- Résolutions de bogue et améliorations
- azureml-automl-core
- Activation de l’inférence du mode batch (prise de plusieurs lignes en une fois) pour les modèles ONNX AutoML
- Amélioration de la détection de la fréquence sur les jeux de données, des données manquantes ou contenant des points de données irréguliers
- Ajout de la possibilité de supprimer des points de données qui ne respectent pas la fréquence dominante.
- azureml-automl-runtime
- Correction du problème qui provoquait la levée d’une erreur si le grain qui n’était pas présent dans le jeu d’entraînement apparaissait dans le jeu de test
- Suppression de l’exigence liée à y_query lors de la notation du service de prévision
- azureml-contrib-mir
- Ajout d’une fonctionnalités dans la classe MirWebservice pour récupérer le jeton d’accès
- azureml-core
- Les services web Azure Machine Learning déployés sont maintenant définis par défaut sur la journalisation
INFO
. Vous pouvez contrôler cela en définissant la variable d’environnementAZUREML_LOG_LEVEL
dans le service déployé. - Correction de l’itération sur
Dataset.get_all
pour retourner tous les jeux de données inscrits auprès de l’espace de travail. - Amélioration du message d’erreur quand un type non valide est passé à l’argument
path
des API de création de jeu de données. - Le Kit de développement logiciel (SDK) Python utilise le service de découverte pour utiliser le point de terminaison « api » au lieu de « pipelines ».
- Basculement vers les nouvelles routes dans tous les appels du SDK
- Modification du routage des appels à ModelManagementService vers une nouvelle structure unifiée
- La méthode de mise à jour de l’espace de travail est désormais publiquement disponible.
- Ajout du paramètre image_build_compute dans la méthode de mise à jour de l’espace de travail afin de permettre à l’utilisateur de mettre à jour le calcul pour la génération d’image
- Ajout de messages de dépréciation à l’ancien workflow de profilage Correction des limites de mémoire et de processeur du profilage
- Les services web Azure Machine Learning déployés sont maintenant définis par défaut sur la journalisation
- azureml-interpret
- Mise à jour d’azureml-interpret vers interpret-community 0.6.*
- azureml-mlflow
- Ajout de la prise en charge des clouds souverains à azureml.mlflow
- azureml-pipeline-steps
- Déplacement de
AutoMLStep
versazureml-pipeline-steps package
. Dépréciation d’AutoMLStep
dansazureml-train-automl-runtime
.
- Déplacement de
- azureml-train-automl-client
- Résolution d’un problème où certains packages pouvaient être installés à des versions incorrectes sur des exécutions distantes.
- azureml-train-automl-runtime
- Résolution du problème de détection de fréquence dans les exécutions distantes
- Déplacement de
AutoMLStep
versazureml-pipeline-steps package
. Dépréciation d’AutoMLStep
dansazureml-train-automl-runtime
.
- azureml-train-core
- Déplacement de
AutoMLStep
versazureml-pipeline-steps package
. Dépréciation d’AutoMLStep
dansazureml-train-automl-runtime
.
- Déplacement de
- azureml-automl-core
18-02-2020
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.1.1rc0 (préversion)
- Résolutions de bogue et améliorations
- azure-cli-ml
- Le profilage d’instance unique a été résolu pour produire une recommandation et a été rendu disponible dans le kit SDK principal.
- azureml-automl-core
- La journalisation des erreurs a été améliorée.
- azureml-automl-runtime
- Correction du problème avec les prévisions lorsque le jeu de données contient des fragments réduits avec de longs laps de temps.
- Correction du problème lorsque l’horizon maximal automatique est activé et que la colonne de date contient des dates sous forme de chaînes. Nous avons ajouté une conversion correcte et une erreur raisonnable si la conversion en date n’est pas possible
- Utilisation de NumPy et SciPy en mode natif pour la sérialisation et la désérialisation des données intermédiaires pour FileCacheStore (utilisé pour les exécutions AutoML locales)
- Correction d’un bogue où les exécutions enfants ayant échoué pouvaient rester bloquées dans l’état d’exécution.
- azureml-cli-common
- Le profilage d’instance unique a été résolu pour produire une recommandation et a été rendu disponible dans le kit SDK principal.
- azureml-core
- Ajout de
--grant-workspace-msi-access
en tant que paramètre supplémentaire pour l’interface CLI de magasin de données dans l’inscription du conteneur d’objets blob Azure, ce qui vous permet d’inscrire un conteneur d’objets blob qui est situé derrière un réseau virtuel - Le profilage d’instance unique a été résolu pour produire une recommandation et a été rendu disponible dans le kit SDK principal.
- Correction du problème dans aks.py _deploy
- Valide l’intégrité des modèles en cours de chargement afin d’éviter les échecs de stockage en mode silencieux.
- Ajout de
- azureml-interpret
- Ajout d’exceptions de style azureml à azureml-interpret
- Correction de la sérialisation DeepScoringExplainer pour les modèles Keras
- azureml-pipeline-core
- Le notebook de scoring par lots du pipeline utilise désormais ParallelRunStep
- azureml-pipeline-steps
- Déplacement d’
AutoMLStep
dans le packageazureml-pipeline-steps
. Dépréciation d’AutoMLStep
dansazureml-train-automl-runtime
.
- Déplacement d’
- azureml-contrib-pipeline-steps
- Paramètre facultatif side_inputs ajouté à ParallelRunStep. Ce paramètre peut être utilisé pour monter le dossier sur le conteneur. Les types actuellement pris en charge sont DataReference et PipelineData.
- azureml-tensorboard
- Mise à jour d’azureml-tensorboard pour prendre en charge TensorFlow 2.0
- azureml-train-automl-client
- Correction du problème de substitution FeaturizationConfig qui filtre la configuration de caractérisation personnalisée.
- azureml-train-automl-runtime
- Déplacement d’
AutoMLStep
dans le packageazureml-pipeline-steps
. Dépréciation d’AutoMLStep
dansazureml-train-automl-runtime
.
- Déplacement d’
- azureml-train-core
- Prise en charge de la version 1.4 de PyTorch dans l’estimateur PyTorch
- azure-cli-ml
2020-02-04
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.1.0rc0 (préversion)
Dernières modifications
- Gestion sémantique de version 2.0.0
- Depuis la version 1.1, le SDK Azure Machine Learning Python adopte Semantic Versioning 2.0.0. Toutes les versions ultérieures suivent le nouveau schéma de numérotation et le contrat de gestion sémantique de version.
- Gestion sémantique de version 2.0.0
Résolutions de bogue et améliorations
- azureml-automl-runtime
- Augmentation de la vitesse de caractérisation.
- Correction de la vérification de la fréquence pendant le scoring. Maintenant, dans les tâches de prévision, nous n’avons pas besoin d’équivalence de fréquence stricte entre l’apprentissage et le jeu de tests.
- azureml-core
- L’utilisateur peut désormais spécifier une valeur pour la clé d’authentification lorsqu’il regénère les clés de services web.
- azureml-interpret
- Mise à jour d’azureml-interpret pour dépendre désormais d’interpret-community 0.5.0
- azureml-pipeline-core
- Correction d’un bogue entraînant une réutilisation incorrecte des résultats PythonScriptStep malgré la modification de la liste d’arguments
- azureml-pipeline-steps
- Ajout d’un exemple de documentation pour le jeu de données sous la forme d’une entrée PythonScriptStep
- azureml-contrib-pipeline-steps
- Les paramètres passés dans ParallelRunConfig peuvent désormais être remplacés en passant des paramètres de pipeline. De nouveaux paramètres de pipeline sont pris en charge : aml_mini_batch_size, aml_error_threshold, aml_logging_level, aml_run_invocation_timeout (aml_node_count et aml_process_count_per_node faisaient déjà partie de la précédente version).
- azureml-automl-runtime
2020-01-21
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.85
Nouvelles fonctionnalités
azureml-core
- Obtenir l’utilisation des cœurs actuelle et la limite de quota pour les ressources AmlCompute dans un espace de travail et un abonnement donnés
azureml-contrib-pipeline-steps
- Permettre à l’utilisateur de passer le jeu de données tabulaire en tant que résultat intermédiaire de l’étape précédente à parallelrunstep
Résolutions de bogue et améliorations
- azureml-automl-runtime
- Suppression de l’exigence de colonne y_query dans la demande envoyée au service de prévision déployé.
- Le « y_query » a été supprimé de la section de la demande de service notebook Orange Juice de Dominick.
- Correction du bogue empêchant les prévisions sur les modèles déployés opérant sur des jeux de données avec des colonnes de date et d’heure.
- Ajout du coefficient de corrélation Matthews en tant que métrique de classification, pour la classification binaire et multiclasse.
- azureml-contrib-interpret
- Suppression des explications de texte d’azureml-contrib-interpret, car une explication du texte a été déplacée vers le référentiel interpret-text qui sera bientôt publié.
- azureml-core
- Jeu de données : les usages pour le jeu de données de fichiers ne dépendent plus de l’installation de numpy et pandas dans l’environnement Python.
- Modification de LocalWebservice.wait_for_deployment() pour vérifier l’état du conteneur Docker local avant d’essayer d’effectuer un test ping de son point de terminaison d’intégrité, ce qui réduit considérablement le temps nécessaire pour signaler un échec de déploiement.
- Correction de l’initialisation d’une propriété interne utilisée dans LocalWebservice.reload() lors de la création de l’objet service à partir d’un déploiement existant à l’aide du constructeur LocalWebservice().
- Modification du message d’erreur pour clarification.
- Ajout d’une nouvelle méthode appelée get_access_token() à AksWebservice, qui retourne l’objet AksServiceAccessToken contenant un jeton d’accès, une actualisation après horodatage, une expiration sur horodatage et un type de jeton.
- Abandon de la méthode get_token() existante dans AksWebservice, car la nouvelle méthode retourne toutes les informations que cette méthode retourne.
- Modification de la sortie de la commande az ml service get-access-token. Changement de nom de token en accessToken et de refreshBy en refreshAfter. Ajout des propriétés expiryOn et tokenType.
- Correction de Fixed get_active_runs
- azureml-explain-model
- mise à jour de shap vers 0.33.0 et d’interpret-community vers 0.4.*
- azureml-interpret
- mise à jour de shap vers 0.33.0 et d’interpret-community vers 0.4.*
- azureml-train-automl-runtime
- Ajout du coefficient de corrélation Matthews en tant que métrique de classification, pour la classification binaire et multiclasse.
- Abandon de l’indicateur de prétraitement du code et remplacement par caractérisation (caractérisation activée par défaut)
- azureml-automl-runtime
2020-01-06
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.83
Nouvelles fonctionnalités
- Jeu de données : ajoutez deux options
on_error
etout_of_range_datetime
pour queto_pandas_dataframe
échoue lorsque les données ont des valeurs d’erreur au lieu de les remplir avecNone
. - Espace de travail : Ajout de l’indicateur
hbi_workspace
pour les espaces de travail avec des données sensibles qui permettent un chiffrement supplémentaire et désactivent les diagnostics avancés sur les espaces de travail. Nous avons également ajouté la prise en charge de l’ajout de vos propres clés pour l’instance Azure Cosmos DB associée, en spécifiant les paramètrescmk_keyvault
etresource_cmk_uri
lors de la création d’un espace de travail, ce qui crée une instance Azure Cosmos DB dans votre abonnement lors de l’approvisionnement de votre espace de travail. Pour en savoir plus, consultez la section Azure Cosmos DB de l’article sur le chiffrement des données.
- Jeu de données : ajoutez deux options
Résolutions de bogue et améliorations
- azureml-automl-runtime
- Correction d’une régression qui provoquait le déclenchement de TypeError lors de l’exécution d’AutoML sur les versions de Python inférieures à 3.5.4.
- azureml-core
- Correction du bogue dans
datastore.upload_files
où un chemin d’accès relatif ne commençant pas par./
n’était pas utilisable. - Ajout de messages de dépréciation pour tous les chemins du code de la classe Image.
- Correction de la construction de l’URL de la gestion des modèles pour Microsoft Azure gérée par 21Vianet.
- Correction du problème selon lequel il n’était pas possible de packager les modèles qui utilisent source_dir pour Azure Functions.
- Ajout d’une option à Environment.build_local() pour pouvoir pousser une image dans le registre de conteneurs de l’espace de travail Azure Machine Learning
- Mise à jour du kit de développement logiciel (SDK) de façon à utiliser la nouvelle bibliothèque de jetons sur Azure Synapse en compatibilité descendante.
- Correction du bogue dans
- azureml-interpret
- Correction du bogue selon lequel None était retourné quand aucune explication n’était téléchargeable. Lève désormais une exception, ce qui correspond aux autres comportements.
- azureml-pipeline-steps
- Ajout de l’interdiction de passer des
DatasetConsumptionConfig
au paramètreinputs
deEstimator
lorsqueEstimator
est utilisé dansEstimatorStep
.
- Ajout de l’interdiction de passer des
- azureml-sdk
- Ajout du client AutoML au package azureml-sdk, ce qui permet d’envoyer les exécutions AutoML distantes sans installer le package AutoML complet.
- azureml-train-automl-client
- Correction de l’alignement sur la sortie de la console pour les exécutions AutoML.
- Correction du bogue selon lequel une mauvaise version de pandas était parfois installée sur amlcompute distant.
- azureml-automl-runtime
2019-12-23
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.81
- Résolutions de bogue et améliorations
- azureml-contrib-interpret
- Report de la dépendance Shap sur interpret-community à partir de azureml-interpret.
- azureml-core
- Ajout de la possibilité d’indiquer la cible de calcul comme paramètre des objets de configuration de déploiement correspondants. Il s’agit en particulier du nom de la cible de calcul sur laquelle le déploiement est effectué, et non de l’objet du kit SDK.
- Ajout d’informations CreatedBy aux objets Model et Service, Accessibles avec .created_by
- Correction de ContainerImage.Run(), qui ne configurait pas correctement le port HTTP du conteneur Docker.
- Possibilité de rendre
azureml-dataprep
facultatif pour la commande CLIaz ml dataset register
. - Correction du bogue selon lequel
TabularDataset.to_pandas_dataframe
revenait à tort sur un autre lecteur et imprimait un avertissement.
- azureml-explain-model
- Report de la dépendance Shap sur interpret-community à partir de azureml-interpret.
- azureml-pipeline-core
- Ajout d’une nouvelle étape de pipeline
NotebookRunnerStep
, consistant à exécuter un bloc-notes local. - Suppression des fonctions get_all dépréciées pour PublishedPipelines, Schedules et PipelineEndpoints.
- Ajout d’une nouvelle étape de pipeline
- azureml-train-automl-client
- Début de la dépréciation de data_script comme entrée d’AutoML.
- azureml-contrib-interpret
09-12-2019
SDK Azure Machine Learning pour Python v1.0.79
- Résolutions de bogue et améliorations
- azureml-automl-core
- Suppression de la journalisation de featurizationConfig
- Journalisation modifiée de manière à journaliser uniquement "auto"/"off"/"customized"
- Suppression de la journalisation de featurizationConfig
- azureml-automl-runtime
- Ajout de la prise en charge de pandas.Series et de pandas.Categorical pour la détection du type de données de la colonne. Avant, seul numpy.ndarray était pris en charge
- Ajout de modifications relatives au code permettant de gérer correctement les types de données de catégorie.
- L’interface de la fonction Forecast a été améliorée : le paramètre y_pred est désormais facultatif. Les docstrings ont été améliorés.
- Ajout de la prise en charge de pandas.Series et de pandas.Categorical pour la détection du type de données de la colonne. Avant, seul numpy.ndarray était pris en charge
- azureml-contrib-dataset
- Correction d’un bogue dans lequel les jeux de données étiquetés ne pouvaient pas être montés.
- azureml-core
- Résolution d’un bogue concernant
Environment.from_existing_conda_environment(name, conda_environment_name)
. L’utilisateur peut créer une instance d’environnement qui soit le réplica exact de l’environnement local - Remplacement des méthodes de jeux de données relatives à la série chronologique par
include_boundary=True
par défaut.
- Résolution d’un bogue concernant
- azureml-train-automl-client
- Résolution d’un problème lors duquel les résultats de validation n’étaient pas affichés quand l’option d’affichage de la sortie était définie sur false.
- azureml-automl-core
2019-11-25
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.76
Dernières modifications
- Problèmes de mise à niveau d’Azureml-Train-AutoML
- La mise à niveau vers azureml-train-automl>=1.0.76 à partir de azureml-train-automl<1.0.76 peut provoquer des installations partielles, entraînant l’échec de certaines importations AutoML. Pour résoudre ce risque, vous pouvez exécuter le script d’installation qui se trouve sur https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/automated-machine-learning/automl_setup.cmd. Ou, si vous utilisez pip directement, vous pouvez :
- « pip install --upgrade azureml-train-automl »
- « pip install --ignore-installed azureml-train-automl-client »
- ou vous pouvez désinstaller l’ancienne version avant la mise à niveau
- « pip uninstall azureml-train-automl »
- « pip install azureml-train-automl »
- La mise à niveau vers azureml-train-automl>=1.0.76 à partir de azureml-train-automl<1.0.76 peut provoquer des installations partielles, entraînant l’échec de certaines importations AutoML. Pour résoudre ce risque, vous pouvez exécuter le script d’installation qui se trouve sur https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/automated-machine-learning/automl_setup.cmd. Ou, si vous utilisez pip directement, vous pouvez :
- Problèmes de mise à niveau d’Azureml-Train-AutoML
Résolutions de bogue et améliorations
- azureml-automl-runtime
- AutoML prend désormais en compte les deux classes true et false lors du calcul des métriques scalaires moyennes pour les tâches de classification binaires.
- Déplacement du Machine Learning et du code de formation dans AzureML-AutoML-Core vers un nouveau package AzureML-AutoML-Runtime.
- azureml-contrib-dataset
- Lorsque vous appelez
to_pandas_dataframe
sur un jeu de données étiqueté avec l’option de téléchargement, vous pouvez choisir de remplacer les fichiers existants. - Lors de l’appel de
keep_columns
oudrop_columns
qui entraîne la suppression d’une colonne de série chronologique, d’étiquette ou d’image, les fonctionnalités correspondantes sont également supprimées pour le jeu de données. - Correction d’un problème avec le chargeur pytorch pour la tâche de détection d’objets.
- Lorsque vous appelez
- azureml-contrib-interpret
- Suppression du widget de tableau de bord d’explication d’azureml-contrib-interpret, package modifié pour référencer le nouveau package dans interpret_community
- Version mise à jour d’interpret-community vers 0.2.0
- azureml-core
- Amélioration des performances de
workspace.datasets
. - Ajout de la possibilité d’inscrire des magasins de données Azure SQL Database à l’aide de l’authentification par nom d’utilisateur et mot de passe
- Correctif pour le chargement RunConfigurations à partir de chemins d’accès relatifs.
- Lors de l’appel de
keep_columns
oudrop_columns
qui entraîne la suppression d’une colonne de série chronologique, les fonctionnalités correspondantes sont également supprimées pour le jeu de données.
- Amélioration des performances de
- azureml-interpret
- version mise à jour d’interpret-community à 0.2.0
- azureml-pipeline-steps
- Valeurs prises en charge documentées pour
runconfig_pipeline_params
pour les étapes de pipeline Machine Learning Azure.
- Valeurs prises en charge documentées pour
- azureml-pipeline-core
- Ajout de l’option CLI pour télécharger la sortie au format json pour les commandes de pipeline.
- azureml-train-automl
- Fractionner AzureML-train-AutoML en deux packages, un package client AzureML-Train-AutoML-Client et un package de formation ML AzureML-Train-AutoML-Runtime
- azureml-train-automl-client
- Ajout d’un client léger pour l’envoi d’expériences AutoML sans avoir à installer de dépendances Machine Learning localement.
- Journalisation fixe des décalages détectés automatiquement, des tailles de fenêtre dynamiques et des horizons maximum dans les exécutions distantes.
- azureml-train-automl-runtime
- Ajout d’un nouveau package AutoML pour isoler les composants de Machine Learning et d’exécution du client.
- azureml-contrib-train-rl
- Ajout de la prise en charge de l’apprentissage de renforcement dans le SDK.
- Ajout de la prise en charge d’AmlWindowsCompute dans RL SDK.
- azureml-automl-runtime
2019-11-11
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.74
Fonctionnalités préliminaires
- azureml-contrib-dataset
- Après l’importation de azureml-contrib-dataset, vous pouvez appeler
Dataset.Labeled.from_json_lines
au lieu de._Labeled
pour créer un jeu de données étiqueté. - Lorsque vous appelez
to_pandas_dataframe
sur un jeu de données étiqueté avec l’option de téléchargement, vous pouvez choisir de remplacer les fichiers existants. - Lors de l’appel de
keep_columns
oudrop_columns
qui entraîne la suppression d’une colonne de série chronologique, d’étiquette ou d’image, les fonctionnalités correspondantes sont également supprimées pour le jeu de données. - Résolution des problèmes liés au chargeur PyTorch lors de l’appel de
dataset.to_torchvision()
.
- Après l’importation de azureml-contrib-dataset, vous pouvez appeler
- azureml-contrib-dataset
Résolutions de bogue et améliorations
- azure-cli-ml
- Ajout du profilage de modèle à l’interface CLI en préversion.
- Corrige le changement cassant dans le Stockage Azure provoquant l’échec de l’interface CLI Azure Machine Learning.
- Ajout du type d’équilibrage de charge à MLC pour les types AKS
- azureml-automl-core
- Correction du problème de détection de l’horizon maximal sur la série chronologique, avec des valeurs manquantes et des niveaux de précision multiples.
- Correction du problème lié aux échecs de génération des découpages de validation croisée.
- Remplacez cette section par un message sous forme de balisage Markdown qui apparaîtra dans les notes de publication : -Amélioration de la gestion des formats réduits dans les jeux de données de prévision.
- Correction du problème de masquage de certaines informations utilisateur lors de la journalisation. -Amélioration de la journalisation des erreurs lors des exécutions de prévisions.
- Ajout de psutil en tant que dépendance Conda au fichier de déploiement yml généré automatiquement.
- azureml-contrib-mir
- Corrige le changement cassant dans le Stockage Azure provoquant l’échec de l’interface CLI Azure Machine Learning.
- azureml-core
- Correction d’un bogue dans lequel les modèles déployés sur Azure Functions produisaient des erreurs de type 500.
- Correction d’un problème dans lequel le fichier amlignore n’était pas appliqué sur les captures instantanées.
- Ajout d’une nouvelle API amlcompute. get_active_runs qui renvoie un générateur pour l’exécution et les exécutions en file d’attente sur un amlcompute donné.
- Ajout du type d’équilibrage de charge à MLC pour les types AKS.
- Ajout du paramètre booléen append_prefix à download_files dans run.py et download_artifacts_from_prefix dans artifacts_client. Cet indicateur est utilisé pour aplatir sélectivement le chemin d’accès d’origine de sorte que seul le nom du fichier ou du dossier est ajouté au output_directory
- Résolvez le problème de désérialisation pour
run_config.yml
avec l’utilisation du jeu de données. - Lors de l’appel de
keep_columns
oudrop_columns
qui entraîne la suppression d’une colonne de série chronologique, les fonctionnalités correspondantes sont également supprimées pour le jeu de données.
- azureml-interpret
- Mise à jour d’interpret-community version sur 0.1.0.3
- azureml-train-automl
- Correction d’un problème où automl_step peut ne pas imprimer les problèmes de validation.
- Correction de register_model pour qu’il aboutisse, même si les dépendances sont manquantes localement dans l’environnement du modèle.
- Résolution d’un problème où certaines exécutions à distance n’étaient pas activées pour le docker.
- Ajoutez la journalisation de l’exception qui provoque l’échec prématuré d’une exécution locale.
- azureml-train-core
- Envisagez l’exécution de resume_from dans le cadre du calcul de la meilleure exécution des enfants de paramétrage automatisé.
- azureml-pipeline-core
- Correction de la gestion des paramètres dans la construction d’arguments du pipeline.
- Ajout de la description du pipeline et du paramètre de type d’étape YAML.
- Nouveau format YAML pour l’étape de pipeline et ajout d’un avertissement de désapprobation pour l’ancien format.
- azure-cli-ml
04-11-2019
Expérience web
La page d’accueil de l’espace de travail collaboratif à l’adresse https://ml.azure.com a été améliorée et rebaptisée « Azure Machine Learning Studio ».
À partir de Studio, vous pouvez effectuer l’apprentissage, le test, le déploiement et la gestion de ressources Azure Machine Learning comme des jeux de données, des pipelines, des modèles, des points de terminaison, etc.
Accédez aux outils de création web suivants à partir de Studio :
Outil basé sur le web | Description |
---|---|
Machines virtuelles de notebooks (préversion) | Station de travail cloud entièrement managée |
Machine Learning automatisé (préversion) | Aucune expérience de code pour l’automatisation du développement de modèles Machine Learning |
Designer | Outil de modélisation Machine Learning par glisser-déplacer précédemment appelé interface visuelle |
Améliorations du concepteur Azure Machine Learning
- Anciennement appelé l’interface visuelle
- 11 nouveaux modules notamment des utilitaires de recommandation, de classement et de formation, avec des fonctionnalités d’ingénierie, de validation croisée et de transformation des données.
SDK R
Les scientifiques des données et les développeurs d’IA utilisent le SDK Azure Machine Learning pour R afin de générer et d’exécuter des workflows de machine learning avec Azure Machine Learning.
Le SDK Azure Machine Learning pour R utilise le package reticulate
pour effectuer une liaison au SDK Python. En se liant directement à Python, le SDK pour R vous permet d’accéder aux objets et méthodes principaux implémentés dans le SDK Python à partir de tout environnement R que vous choisissez.
Les principales fonctionnalités du SDK sont les suivantes :
- Gérez les ressources cloud pour la surveillance, la journalisation et l’organisation de vos expériences de Machine Learning.
- Formez des modèles à l’aide de ressources cloud, y compris la formation du modèle avec accélération GPU.
- Déployez vos modèles en tant que services web sur Azure Container Instances (ACI) et Azure Kubernetes Service (AKS).
Pour obtenir une documentation complète, consultez le site web du package.
Intégration entre Azure Machine Learning et Event Grid
Azure Machine Learning est désormais un fournisseur de ressources pour Event Grid. Il est possible de configurer des événements Machine Learning sur le Portail Azure ou avec Azure CLI. Les utilisateurs peuvent créer des événements pour la fin d’une exécution, l’inscription de modèles, le déploiement de modèles et la détection d’une dérive de données. Ces événements peuvent être routés vers des gestionnaires d’événements pris en charge par Event Grid à des fins de consommation. Pour plus d’informations, voir les articles schema et tutorial sur les événements Machine Learning.
2019-10-31
SDK Azure Machine Learning pour Python v1.0.72
Nouvelles fonctionnalités
Ajout de superviseurs de jeu de données via le package azureml-datadrift, permettant la supervision des jeux de données de série chronologique pour détecter la dérive de données ou d’autres modifications statistiques au fil du temps. Des alertes et des événements peuvent être déclenchés si une dérive est détectée ou si d’autres conditions sur les données sont remplies. Consultez notre documentation pour plus d’informations.
Annonce de deux nouvelles éditions (également appelées références SKU) dans Azure Machine Learning. Avec cette version, vous pouvez désormais créer un espace de travail Azure Machine Learning De base ou Entreprise. Tous les espaces de travail existants sont dirigés par défaut vers l’édition De base, et vous pouvez accéder au portail Azure ou à Studio pour mettre à niveau l’espace de travail à tout moment. Vous pouvez créer un espace de travail De base ou Entreprise à partir du portail Azure. Lisez notre documentation pour en savoir plus. À partir du SDK, l’édition de votre espace de travail peut être déterminée à l’aide de la propriété « sku » de votre objet espace de travail.
Nous avons également apporté des améliorations à la Capacité de calcul Azure Machine Learning : vous pouvez désormais visualiser les métriques de vos clusters (comme le nombre total de nœuds, les nœuds en cours d’exécution, le quota total de cœurs) dans Azure Monitor, en plus de la visualisation des journaux de diagnostic pour le débogage. En outre, vous pouvez également afficher les exécutions en cours ou en file d’attente sur votre cluster et des détails comme les adresses IP des différents nœuds de votre cluster. Vous pouvez les afficher dans le portail ou à l’aide des fonctions correspondantes dans le SDK ou l’interface CLI.
Fonctionnalités préliminaires
- Nous publions la prise en charge de la préversion du chiffrement de disque pour votre disque SSD local dans la Capacité de calcul Azure Machine Learning. Créez un ticket de support technique pour obtenir que votre abonnement soit mis en liste verte afin d’utiliser cette fonctionnalité.
- Préversion publique d’Azure Machine Learning Batch Inference. Azure Machine Learning Batch Inference cible des travaux d’inférence de grande taille qui ne sont pas sensibles au temps. Batch Inference fournit une mise à l’échelle de calcul d’inférence économique avec un débit inégalé pour les applications asynchrones. Ce système est optimisée pour les débits élevés et les inférences autonomes (fire and forget) sur des ensembles de données volumineux.
- azureml-contrib-dataset
- Fonctionnalités activées pour le jeu de données étiqueté
import azureml.core from azureml.core import Workspace, Datastore, Dataset import azureml.contrib.dataset from azureml.contrib.dataset import FileHandlingOption, LabeledDatasetTask # create a labeled dataset by passing in your JSON lines file dataset = Dataset._Labeled.from_json_lines(datastore.path('path/to/file.jsonl'), LabeledDatasetTask.IMAGE_CLASSIFICATION) # download or mount the files in the `image_url` column dataset.download() dataset.mount() # get a pandas dataframe from azureml.data.dataset_type_definitions import FileHandlingOption dataset.to_pandas_dataframe(FileHandlingOption.DOWNLOAD) dataset.to_pandas_dataframe(FileHandlingOption.MOUNT) # get a Torchvision dataset dataset.to_torchvision()
Résolutions de bogue et améliorations
- azure-cli-ml
- L’interface CLI prend désormais en charge le packaging de modèle.
- Ajout d’interface CLI de jeu de données. Pour plus d’informations :
az ml dataset --help
- Ajout de la prise en charge du déploiement et du packaging des modèles pris en charge (ONNX, scikit-learn et TensorFlow) sans instance InferenceConfig.
- Ajout de l’indicateur de remplacement pour le déploiement de service (ACI et AKS) dans le SDK et l’interface CLI. S’il est fourni, l’indicateur remplace le service existant si le service portant le nom existe déjà. Si le service n’existe pas, un nouveau service est créé.
- Les modèles peuvent être inscrits avec deux nouveaux frameworks, Onnx et TensorFlow. - L’inscription de modèle accepte les exemples de données d’entrée, les exemples de données de sortie et la configuration des ressources pour le modèle.
- azureml-automl-core
- L’apprentissage d’une itération s’exécute dans un processus enfant uniquement lorsque des contraintes d’exécution sont définies.
- Ajout d’une barrière de sécurité pour les tâches de prévision, afin de vérifier si une valeur max_horizon spécifiée entraîne un problème de mémoire sur l’ordinateur donné. Si c’est le cas, un message de barrière de sécurité s’affiche.
- Ajout de la prise en charge de fréquences complexes comme deux ans et un 1 mois. -Ajout d’un message d’erreur compréhensible si la fréquence ne peut pas être déterminée.
- Ajout d’azureml-defaults à la génération automatique conda env pour résoudre l’échec du déploiement du modèle
- La conversion des données intermédiaires en jeu de données tabulaire est autorisée dans le pipeline Azure Machine Learning, ainsi que leur utilisation dans
AutoMLStep
. - Mise à jour de l’objectif de colonne implémentée pour le streaming.
- Mise à jour du paramètre de transformateur implémentée pour Imputer et HashOneHotEncoder pour le streaming.
- Ajout de la taille de données actuelle et de la taille de données minimale requise aux messages d’erreur de validation.
- Mise à jour de la taille de données minimale requise pour la validation croisée afin de garantir un minimum de deux échantillons dans chaque pli de validation.
- azureml-cli-common
- L’interface CLI prend désormais en charge le packaging de modèle.
- Les modèles peuvent être inscrits avec deux nouveaux frameworks, Onnx et TensorFlow.
- L’inscription de modèle accepte les exemples de données d’entrée, les exemples de données de sortie et la configuration des ressources pour le modèle.
- azureml-contrib-gbdt
- Correction du canal de publication du Notebook
- Ajout d’un avertissement pour la cible de calcul non AmlCompute que nous ne prenons pas en charge
- Ajout de l’estimateur LightGMB au package azureml-contrib-gbdt
- azureml-core
- L’interface CLI prend désormais en charge le packaging de modèle.
- Ajout d’un avertissement d’obsolescence pour les API de jeu de données dépréciées. Consultez l’avis de modification de l’API de jeu de données sur https://aka.ms/tabular-dataset.
- Modification de
Dataset.get_by_id
pour retourner le nom et la version de l’inscription si le jeu de données est inscrit. - Correction d’un bogue qui fait que ScriptRunConfig avec le jeu de données en tant qu’argument ne peut pas être utilisé à plusieurs reprises pour soumettre une exécution expérimentale.
- Les jeux de données récupérés pendant une exécution feront l’objet d’un suivi et peuvent être consultés dans la page des détails de l’exécution ou en appelant
run.get_details()
une fois l’exécution terminée. - La conversion des données intermédiaires en jeu de données tabulaire est autorisée dans le pipeline Azure Machine Learning, ainsi que leur utilisation dans
AutoMLStep
. - Ajout de la prise en charge du déploiement et du packaging des modèles pris en charge (ONNX, scikit-learn et TensorFlow) sans instance InferenceConfig.
- Ajout de l’indicateur de remplacement pour le déploiement de service (ACI et AKS) dans le SDK et l’interface CLI. S’il est fourni, l’indicateur remplace le service existant si le service portant le nom existe déjà. Si le service n’existe pas, un nouveau service est créé.
- Les modèles peuvent être inscrits avec deux nouveaux frameworks, Onnx et TensorFlow. L’inscription de modèle accepte les exemples de données d’entrée, les exemples de données de sortie et la configuration des ressources pour le modèle.
- Ajout d’un nouveau magasin de données pour Azure Database pour MySQL. Ajout d’un exemple pour l’utilisation d’Azure Database pour MySQL dans DataTransferStep dans des pipelines Azure Machine Learning.
- Ajout de fonctionnalités pour ajouter et supprimer des balises dans des expérimentations - Ajout de fonctionnalités pour supprimer des balises dans les exécutions
- Ajout de l’indicateur de remplacement pour le déploiement de service (ACI et AKS) dans le SDK et l’interface CLI. S’il est fourni, l’indicateur remplace le service existant si le service portant le nom existe déjà. Si le service n’existe pas, un nouveau service est créé.
- azureml-datadrift
- Déplacé de
azureml-contrib-datadrift
versazureml-datadrift
- Ajout de la prise en charge de la surveillance des jeux de données TimeSeries pour la dérive et d’autres mesures statistiques
- Nouvelles méthodes
create_from_model()
etcreate_from_dataset()
ajoutées à la classeDataDriftDetector
. La méthodecreate()
est déconseillée. - Ajustements des visualisations dans Python et l’interface utilisateur dans Azure Machine Learning Studio.
- Prise en charge de la planification des analyses hebdomadaires et mensuelles, en plus des analyses quotidiennes des jeux de données.
- Prise en charge du renvoi des métriques du moniteur de données pour analyser les données historiques des analyses de jeu de données.
- Divers correctifs de bogues
- Déplacé de
- azureml-pipeline-core
- azureml-dataprep n’est plus nécessaire pour soumettre une exécution de pipeline Azure Machine Learning à partir du fichier
yaml
du pipeline.
- azureml-dataprep n’est plus nécessaire pour soumettre une exécution de pipeline Azure Machine Learning à partir du fichier
- azureml-train-automl
- Ajout d’azureml-defaults à la génération automatique conda env pour résoudre l’échec du déploiement du modèle
- La formation à distance AutoML comprend désormais les valeurs azureml-defaults pour permettre la réutilisation de l’environnement de formation pour l’inférence.
- azureml-train-core
- Ajout de la prise en charge de PyTorch 1.3 dans l’estimateur
PyTorch
- Ajout de la prise en charge de PyTorch 1.3 dans l’estimateur
- azure-cli-ml
2019-10-21
Interface visuelle (préversion)
L’interface visuelle Azure Machine Learning (préversion) a été repensée pour s’exécuter sur les pipelines Azure Machine Learning. Les pipelines (auparavant appelés expériences) créés dans l’interface visuelle sont désormais entièrement intégrés à l’expérience de base Azure Machine Learning.
- Expérience de gestion unifiée avec des ressources de kit de développement logiciel (SDK)
- Contrôle de version et suivi des modèles d’interface visuels, des pipelines et des points de terminaison
- Interface utilisateur repensée
- Ajout du déploiement Batch Inference
- Ajout de la prise en charge d’Azure Kubernetes service (AKS) pour les des cibles de calcul de l’inférence
- Nouveau flux de travail de création de pipeline au niveau de Python
- Nouvelle page de destination pour les outils de création visuelle
Nouveaux modules
- Appliquer une opération mathématique
- Appliquer une transformation SQL
- Limiter les valeurs
- Totaliser les données
- Importer à partir de la base de données SQL
2019-10-14
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.69
- Résolutions de bogue et améliorations
- azureml-automl-core
- Limitation des explications de modèle à exécuter au mieux au lieu de calculer les explications pour chaque exécution. Modification de ce comportement pour local, remote et ADB.
- Ajout de la prise en charge des explications de modèle à la demande pour l’interface utilisateur
- Ajout de psutil en tant que dépendance de
automl
et psutil inclus en tant que dépendance conda dans amlcompute. - Correction du problème lié aux décalages heuristiques et aux tailles de fenêtre dynamique sur les jeux de données de prévisions, dont certaines séries peuvent provoquer des erreurs algébriques linéaires
- Ajout de l’impression pour les paramètres déterminés de manière heuristique dans les exécutions de prévision.
- azureml-contrib-datadrift
- Ajout de la protection lors de la création de métriques de sortie si la dérive du niveau de jeu de données ne figure pas dans la première section.
- azureml-contrib-interpret
- Le package azureml-contrib-explain-model a été renommé en azureml-contrib-interpret
- azureml-core
- API ajoutée pour annuler l’inscription des jeux de données.
dataset.unregister_all_versions()
- Le package azureml-contrib-explain-model a été renommé azureml-contrib-interpret.
- API ajoutée pour annuler l’inscription des jeux de données.
- azureml-core
- API ajoutée pour annuler l’inscription des jeux de données. dataset.unregister_all_versions().
- Ajout de l’API de jeu données pour vérifier l’heure de modification des données.
dataset.data_changed_time
. - Pouvoir utiliser
FileDataset
etTabularDataset
en tant qu’entrées pourPythonScriptStep
,EstimatorStep
etHyperDriveStep
dans le pipeline Azure Machine Learning - Les performances de
FileDataset.mount
ont été améliorées pour les dossiers avec un grand nombre de fichiers - Pouvoir consommer FileDataset et TabularDataset comme entrées pour PythonScriptStep, EstimatorStep et HyperDriveStep dans le pipeline Azure Machine Learning.
- Les performances de FileDataset.mount() ont été améliorées pour les dossiers avec un grand nombre de fichiers
- Ajout de l’URL aux recommandations d’erreurs connues dans les détails de l’exécution.
- Correction d’un bogue dans run.get_metrics lors duquel les demandes échouaient si une exécution avait un trop grand nombre d’enfants
- Correction d’un bogue dans run.get_metrics lors duquel les demandes échouaient si une exécution avait un trop grand nombre d’enfants
- Ajout de la prise en charge de l’authentification sur le cluster Arcadia.
- La création d’un objet Experiment permet d’obtenir ou de créer l’expérience dans l’espace de travail Azure Machine Learning pour le suivi de l’historique des exécutions. L’ID d’expérience et l’heure archivée sont renseignés dans l’objet Experiment lors de la création. Exemple : experiment = Experiment(workspace, "New Experiment") experiment_id = experiment.id archive() et reactivate() sont des fonctions qui peuvent être appelées dans une expérience pour masquer et restaurer l’expérience à partir de l’expérience utilisateur ou retournées par défaut dans un appel pour répertorier les expériences. Si une nouvelle expérience est créée avec le même nom qu’une expérience archivée, vous pouvez renommer l’expérience archivée lors de la réactivation en transmettant un nouveau nom. Il ne peut y avoir qu’une seule expérience active avec un nom donné. Exemple : experiment1 = Experiment(workspace, "Active Experiment") experiment1.archive() # Créez une nouvelle expérience active portant le même nom que celle archivée. experiment2. = Experiment(workspace, "Active Experiment") experiment1.reactivate(new_name="Previous Active Experiment") La liste de méthodes statiques() dans Experiment peut accepter un filtre de nom et un filtre ViewType. Les valeurs ViewType sont "ACTIVE_ONLY", "ARCHIVED_ONLY" et "ALL" Exemple : archived_experiments = Experiment.list(workspace, view_type="ARCHIVED_ONLY") all_first_experiments = Experiment.list(workspace, name="First Experiment", view_type="ALL")
- Prise en charge de l’utilisation de l’environnement pour le déploiement de modèle et la mise à jour du service.
- azureml-datadrift
- L’attribut show de la classe DataDriftDector ne prend plus en charge l’argument facultatif 'with_details'. L’attribut show affiche uniquement le coefficient de dérive des données et la contribution à la dérive des données des colonnes de caractéristiques.
- Modifications du comportement de l’attribut DataDriftDetector « get_Output » :
- les paramètres d’entrée start_time et end_time sont facultatifs au lieu d’obligatoires ;
- Les entrées spécifiques start_time et/ou end_time avec un run_id spécifique dans le même appel entraînent une exception d’erreur de valeur, car elles s’excluent mutuellement
- Lorsque vous entrez des valeurs spécifiques pour start_time et/ou end_time, seuls les résultats des exécutions planifiées sont retournés ;
- Le paramètre « daily_latest_only » est déconseillé.
- Prise en charge de la récupération des sorties de dérive des données basées sur les jeux de données.
- azureml-explain-model
- Renomme le package AzureML-explain-model en AzureML-interpret, en conservant l’ancien package pour la compatibilité descendante pour le moment
- Correction du bogue
automl
avec des explications brutes définies sur la tâche de classification au lieu de la régression par défaut lors d’un téléchargement à partir d’ExplanationClient - Ajout de la prise en charge de
ScoringExplainer
à créer directement à l’aide deMimicWrapper
- azureml-pipeline-core
- Amélioration des performances pour la création de pipelines volumineux
- azureml-train-core
- Ajout de la prise en charge de TensorFlow 2.0 dans l’estimateur TensorFlow
- azureml-train-automl
La création d’un objet Experiment permet d’obtenir ou de créer l’expérience dans l’espace de travail Azure Machine Learning pour le suivi de l’historique des exécutions. L’ID d’expérience et l’heure archivée sont renseignés dans l’objet Experiment lors de la création. Exemple :
experiment = Experiment(workspace, "New Experiment") experiment_id = experiment.id
archive() et reactivate() sont des fonctions qui peuvent être appelées dans une expérience pour masquer et restaurer l’expérience à partir de l’expérience utilisateur ou retournées par défaut dans un appel pour répertorier les expériences. Si une nouvelle expérience est créée avec le même nom qu’une expérience archivée, vous pouvez renommer l’expérience archivée lors de la réactivation en transmettant un nouveau nom. Il ne peut y avoir qu’une seule expérience active avec un nom donné. Exemple :
experiment1 = Experiment(workspace, "Active Experiment") experiment1.archive() # Create new active experiment with the same name as the archived. experiment2 = Experiment(workspace, "Active Experiment") experiment1.reactivate(new_name="Previous Active Experiment")
La méthode statique list() dans Experiment peut accepter un filtre de nom et un filtre ViewType. Les valeurs ViewType sont « ACTIVE_ONLY », « ARCHIVED_ONLY » et « ALL ». Exemple :
archived_experiments = Experiment.list(workspace, view_type="ARCHIVED_ONLY") all_first_experiments = Experiment.list(workspace, name="First Experiment", view_type="ALL")
Prise en charge de l’utilisation de l’environnement pour le déploiement de modèle et la mise à jour du service.
- azureml-datadrift
- L’attribut show de la classe DataDriftDetector ne prend plus en charge l’argument facultatif « with_details ». L’attribut show affiche uniquement le coefficient de dérive des données et la contribution à la dérive des données des colonnes de caractéristiques.
- Le comportement de la fonction DataDriftDetector [get_output]python/api/azureml-datadrift/azureml.datadrift.datadriftdetector.datadriftdetector#get-output-start-time-none--end-time-none--run-id-none-) change :
- les paramètres d’entrée start_time et end_time sont facultatifs au lieu d’obligatoires ;
- Les entrées spécifiques start_time et/ou end_time avec un run_id spécifique dans le même appel entraînent une exception d’erreur de valeur, car elles s’excluent mutuellement ;
- Lorsque vous entrez des valeurs spécifiques pour start_time et/ou end_time, seuls les résultats des exécutions planifiées sont retournés ;
- Le paramètre « daily_latest_only » est déconseillé.
- Prise en charge de la récupération des sorties de dérive des données basées sur les jeux de données.
- azureml-explain-model
- Ajout de la prise en charge de ScoringExplainer pour une création directe à l’aide de MimicWrapper
- azureml-pipeline-core
- Amélioration des performances pour la création de pipelines volumineux.
- azureml-train-core
- Ajout de la prise en charge de TensorFlow 2.0 dans l’estimateur TensorFlow.
- azureml-train-automl
- L’exécution parente n’est plus en échec en cas d’échec de l’itération du programme d’installation, car l’orchestration s’en charge déjà.
- Ajout de la prise en charge de local-docker et local-conda pour les expériences AutoML
- Ajout de la prise en charge de local-docker et local-conda pour les expériences AutoML.
- azureml-automl-core
2019-10-08
Nouvelle expérience web (préversion) pour les espaces de travail Azure Machine Learning
L’onglet Expérience dans le nouveau portail des espaces de travail a été mis à jour pour que les scientifiques des données puissent superviser leurs expériences de manière plus performante. Vous pouvez explorer les fonctionnalités suivantes :
- Métadonnées d’expérience pour filtrer et trier facilement votre liste d’expériences
- Pages de détails des expériences simplifiées et performantes pour vous permettre de visualiser et de comparer vos exécutions
- Nouvelle conception des pages de détails des exécutions pour comprendre et superviser vos exécutions d’entraînement
30-09-2019
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.65
Nouvelles fonctionnalités
- Ajout d’environnements organisés. Ces environnements ont été préconfigurés avec des bibliothèques pour des tâches de Machine Learning courantes, et ont été précompilés et mis en cache en tant qu’images Docker afin d’accélérer l’exécution. Celles-ci s’affichent par défaut dans la liste d’environnements de l’espace de travail, avec le préfixe « AzureML ».
- Ajout d’environnements organisés. Ces environnements ont été préconfigurés avec des bibliothèques pour des tâches de Machine Learning courantes, et ont été précompilés et mis en cache en tant qu’images Docker afin d’accélérer l’exécution. Celles-ci s’affichent par défaut dans la liste d’environnements de l’espace de travail, avec le préfixe « AzureML ».
azureml-train-automl
-
- Ajout de la prise en charge de la conversion ONNX pour ADB et HDI
Fonctionnalités préliminaires
azureml-train-automl
-
- BERT et BiLSTM pris en charge en tant que caractériseur de texte (préversion uniquement)
- Personnalisation de caractérisation prise en charge pour les paramètres d’objet de colonne et de transformateur (préversion uniquement)
- Explications brutes prises en charge lorsque l’utilisateur active l’explication du modèle pendant l’apprentissage (préversion uniquement)
- Ajout de Prophet pour les prévisions
timeseries
en tant que pipeline apte à l’apprentissage (préversion uniquement)
azureml-contrib-datadrift
- Déplacement de packages d’azureml-contrib-datadrift vers azureml-datadrift ; le package
contrib
sera supprimé dans une mise en production ultérieure
- Déplacement de packages d’azureml-contrib-datadrift vers azureml-datadrift ; le package
Résolutions de bogue et améliorations
- azureml-automl-core
- Introduction de FeaturizationConfig dans AutoMLConfig et AutoMLBaseSettings
- Introduction de FeaturizationConfig dans AutoMLConfig et AutoMLBaseSettings
- Remplacement de l’objectif de la colonne pour caractérisation avec une colonne et un type de caractéristique donnés
- Remplacement des paramètres du transformateur
- Ajout d’un message de dépréciation pour explain_model() et retrieve_model_explanations()
- Ajout de Prophet en tant que pipeline apte à l’apprentissage (préversion uniquement)
- Ajout d’un message de dépréciation pour explain_model() et retrieve_model_explanations().
- Ajout de Prophet en tant que pipeline apte à l’apprentissage (préversion uniquement).
- Ajout de la prise en charge de la détection automatique des décalages cibles, de la taille de fenêtre dynamique et de l’horizon maximal. Si l’une des valeurs target_lags, target_rolling_window_size ou max_horizon est définie sur « auto », les heuristiques sont appliquées pour estimer la valeur du paramètre correspondant en fonction des données d’apprentissage.
- Correction des prévisions lorsque le jeu de données contient une colonne de grain ; ce grain est de type numérique et il y a un écart entre l’apprentissage et le jeu de test
- Correction du message d’erreur relatif à l’index dupliqué dans la série distante des tâches de prévision
- Correction des prévisions lorsque le jeu de données contient une colonne de grain ; ce grain est de type numérique et il y a un écart entre l’apprentissage et le jeu de test.
- Correction du message d’erreur relatif à l’index dupliqué dans la série distante des tâches de prévision.
- Ajout d’une barrière de sécurité pour vérifier si un jeu de données est déséquilibré. Si c’est le cas, un message de barrière de sécurité s’affiche sur la console.
- azureml-core
- Ajout de la possibilité de récupérer l’URL SAP du modèle dans le stockage via l’objet de modèle Ex. : model.get_sas_url()
- Introduction de
run.get_details()['datasets']
pour obtenir des jeux de données associés à l’exécution envoyée - Ajout de l’API
Dataset.Tabular.from_json_lines_files
pour créer un TabularDataset à partir de fichiers Lignes JSON. Pour en savoir plus sur ces données tabulaires dans les fichiers de Lignes JSON sur TabularDataset, consultez cet article pour accéder à la documentation. - Ajout d’autres champs de taille de machine virtuelle (disque du système d’exploitation, nombre de GPU) à la fonction supported_vmsizes()
- Ajout d’autres champs à la fonction list_nodes() pour afficher l’exécution, les adresses IP privée et publique, le port, etc.
- Possibilité de spécifier un nouveau champ pendant le provisionnement du cluster, --remotelogin_port_public_access, qui peut être défini sur activé ou désactivé selon que vous souhaitez laisser le port SSH ouvert ou fermé au moment de la création du cluster. Si vous ne le spécifiez pas, le service ouvre ou ferme intelligemment le port selon que vous déployez ou non le cluster à l’intérieur d’un réseau virtuel.
- azureml-explain-model
- azureml-core
- Ajout de la possibilité de récupérer l’URL SAP du modèle dans le stockage via l’objet de modèle Ex. : model.get_sas_url()
- Introduction de run.get_details['datasets'] pour obtenir des jeux de données associés à l’exécution envoyée
- Ajout de l’API
Dataset.Tabular
.from_json_lines_files() pour créer un TabularDataset à partir de fichiers Lignes JSON. Pour découvrir ces données tabulaires dans les fichiers Lignes JSON sur TabularDataset, visitez la page https://aka.ms/azureml-data pour accéder à la documentation. - Ajout d’autres champs de taille de machine virtuelle (disque du système d’exploitation, nombre de GPU) à la fonction supported_vmsizes()
- Ajout d’autres champs à la fonction list_nodes() pour afficher l’exécution, les adresses IP privée et publique, le port, etc.
- Possibilité de spécifier un nouveau champ pendant le provisionnement du cluster, que vous pouvez activer ou désactiver pour laisser le port SSH ouvert ou fermé au moment de la création du cluster. Si vous ne le spécifiez pas, le service ouvre ou ferme intelligemment le port selon que vous déployez ou non le cluster à l’intérieur d’un réseau virtuel.
- azureml-explain-model
- Amélioration de la documentation pour les sorties d’explication dans le scénario de classification.
- Ajout de la possibilité de charger les valeurs y prédites sur l’explication des exemples d’évaluation. Déverrouille des visualisations plus utiles.
- Ajout de la propriété explainer à MimicWrapper pour permettre l’obtention du MimicExplainer sous-jacent.
- azureml-pipeline-core
- Ajout d’un bloc-notes pour décrire Module, ModuleVersion et ModuleStep
- azureml-pipeline-steps
- Ajout de RScriptStep pour prendre en charge l’exécution de script R via le pipeline AML.
- Correction de l’analyse des paramètres de métadonnées dans AzureBatchStep qui générait le message d’erreur « Assignment for parameter SubscriptionId is not specified » (L’affectation du paramètre SubscriptionId n’est pas spécifiée).
- azureml-train-automl
- Prise en charge de training_data, validation_data, label_column_name, weight_column_name en tant que format d’entrée de données
- Ajout d’un message de dépréciation pour explain_model() et retrieve_model_explanations()
- azureml-pipeline-core
- Ajout d’un bloc-notes pour décrire Module, [ModuleVersion, et ModuleStep.
- azureml-pipeline-steps
- Ajout de RScriptStep pour prendre en charge l’exécution de script R via le pipeline AML.
- Correction de l’analyse des paramètres de métadonnées dans AzureBatchStep qui générait le message d’erreur « Assignment for parameter SubscriptionId is not specified » (L’affectation du paramètre SubscriptionId n’est pas spécifiée).
- azureml-train-automl
- Prise en charge de training_data, validation_data, label_column_name, weight_column_name en tant que format d’entrée de données.
- Ajout d’un message de dépréciation pour explain_model() et retrieve_model_explanations().
- azureml-automl-core
2019-09-16
Kit SDK Azure Machine Learning pour Python v1.0.62
Nouvelles fonctionnalités
Introduction de la caractéristique
timeseries
sur TabularDataset. Cette caractéristique permet de filtrer facilement les horodatages sur les données TabularDataset, par exemple capturer toutes les données d’une plage de temps ou les données les plus récentes. https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/work-with-data/datasets-tutorial/timeseries-datasets/tabular-timeseries-dataset-filtering.ipynb pour accéder à un exemple de notebook.Activation de l’entraînement avec TabularDataset et FileDataset.
azureml-train-core
- Ajout de la prise en charge de
Nccl
etGloo
dans PyTorch Estimator
- Ajout de la prise en charge de
Résolutions de bogue et améliorations
- azureml-automl-core
- Le paramètre AutoML « lag_length » et LaggingTransformer ont été dépréciés.
- Correction de la validation des données d’entrée si elles sont spécifiées dans un format Dataflow
- Modification de fit_pipeline.py pour générer le json de graphe et charger dans les artefacts.
- Rendu du graphe sous
userrun
à l’aide deCytoscape
.
- azureml-core
- Nous avons révisé la gestion des exceptions dans le code ADB et apporté des modifications en fonction de la nouvelle gestion des erreurs
- Ajout de l’authentification MSI automatique pour les machines virtuelles de notebook.
- Correction d’un bogue où des modèles endommagés ou vides pouvaient être chargés en raison de l’échec des nouvelles tentatives.
- Correction du bogue qui provoquait le changement du nom
DataReference
lors du changement du modeDataReference
(par exemple lors de l’appel deas_upload
,as_download
ouas_mount
). mount_point
ettarget_path
sont désormais facultatifs pourFileDataset.mount
etFileDataset.download
.- Une exception, indiquant que la colonne timestamp est introuvable, est exclue si l’API associée aux séries chronologiques est appelée sans que la bonne colonne timestamp assignée ou que les colonnes timestamp assignées ne soient supprimées.
- Les colonnes de séries chronologiques doivent être assignées avec une colonne de type Date, sinon une exception est attendue.
- Les colonnes de séries chronologiques affectant l’API « with_timestamp_columns » peuvent prendre la valeur None pour le nom de colonne timestamp fine/grossière, ce qui effacera les colonnes timestamp précédemment affectées.
- Une exception est levée quand la colonne timestamp fine ou grossière est supprimée, avec une indication signalant à l’utilisateur que la suppression peut être effectuée soit après l’exclusion de la colonne timestamp de la liste de suppression, soit par l’appel de with_time_stamp avec une valeur None pour libérer les colonnes timestamp.
- Une exception est levée quand la colonne timestamp fine ou grossière n’est pas incluse dans la liste de colonnes à conserver, avec une indication signalant à l’utilisateur que la conservation peut être effectuée soit après l’inclusion de la colonne timestamp dans la liste des colonnes à conserver, soit par l’appel de with_time_stamp avec une valeur None pour libérer les colonnes timestamp.
- Ajout de la journalisation de la taille d’un modèle inscrit.
- azureml-explain-model
- Correction de l’avertissement affiché sur la console quand le package Python « packaging » n’est pas installé : « Utilisation d’une version antérieure à la version prise en charge de lightgbm. Veuillez effectuer une mise à niveau vers une version supérieure à 2.2.1 ».
- Correction de l’explication relative au modèle de téléchargement avec partitionnement pour des explications globales avec de nombreuses fonctionnalités.
- Correction des exemples MimicExplainer où il manquait l’initialisation lors de l’explication sur la sortie.
- Correction d’une erreur immuable sur les propriétés de définition lors du chargement avec client d’explication utilisant deux types de modèles différents.
- Ajout d’un paramètre get_raw à l’explainer de scoring .explain() afin qu’un explainer de scoring puisse retourner à la fois des valeurs de conception et des valeurs brutes.
- azureml-train-automl
- Introduction d’API publiques d’AutoML pour prendre en charge les explications à partir du SDK d’explication
automl
. Nouvelle manière de prendre en charge les explications AutoML en découplant la caractérisation AutoML et le SDK d’explication. Intégration de la prise en charge de l’explication brute à partir du SDK d’explication automl pour les modèles AutoML. - Suppression d’azureml-defaults des environnements d’entraînement à distance.
- Modification de l’emplacement du magasin de cache par défaut de FileCacheStore en AzureFileCacheStore pour AutoML sur le chemin de code Azure Databricks.
- Correction de la validation des données d’entrée si elles sont spécifiées dans un format Dataflow
- Introduction d’API publiques d’AutoML pour prendre en charge les explications à partir du SDK d’explication
- azureml-train-core
Annulation de la dépréciation de source_directory_data_store.
Ajout de la possibilité de remplacer les versions de packages installés par azureml.
Ajout de la prise en charge de dockerfile dans le paramètre
environment_definition
dans les estimateurs.Simplification des paramètres d’entraînement distribué dans les estimateurs.
from azureml.train.dnn import TensorFlow, Mpi, ParameterServer
- azureml-automl-core
2019-09-09
Nouvelle expérience web (préversion) pour les espaces de travail Azure Machine Learning
La nouvelle expérience web permet aux chercheurs de données et aux ingénieurs de données d’effectuer leur cycle de vie Machine Learning de bout en bout, de la préparation et la visualisation des données à la formation et au déploiement des modèles dans un emplacement unique.
Fonctionnalités clés :
À l’aide de cette nouvelle interface Azure Machine Learning, vous pouvez désormais :
- Gérer vos notebooks ou le lien vers Jupyter
- Exécuter des expériences de Machine Learning automatisé
- Créer des jeux de données à partir de fichiers locaux, de banques de données et de fichiers web
- Explorer et préparer les jeux de données pour la création de modèles
- Surveiller la dérive des données pour vos modèles
- Afficher les ressources récentes à partir d’un tableau de bord
Au moment de cette publication, les navigateurs suivants sont pris en charge : Chrome, Firefox, Safari et la préversion Microsoft Edge.
Problèmes connus :
Actualisez votre navigateur si vous voyez s’afficher le message « Un problème s’est produit. Erreur lors du chargement des fichiers blocs » lorsque le déploiement est en cours.
Impossible de supprimer ou de renommer un fichier dans Notebooks et Files. Pendant la préversion publique, vous pouvez utiliser le terminal ou l’interface utilisateur Jupyter sur la machine virtuelle Notebook pour effectuer les opérations de mise à jour des fichiers. Étant donné qu’il s’agit d’un système de fichiers réseau monté, toutes les modifications que vous apportez à la machine virtuelle Notebook sont immédiatement reflétées dans l’espace de travail Notebook.
Pour une connexion SSH à la machine virtuelle Notebook :
- Recherchez les clés SSH qui ont été créées lors de la configuration de la machine virtuelle. Ou bien, recherchez les clés dans l’espace de travail Azure Machine Learning > ouvrez l’onglet Calcul > localisez la machine virtuelle Notebook dans la liste > ouvrez ses propriétés : copiez les clés à partir de la boîte de dialogue.
- Importez ces clés SSH publiques et privées sur votre ordinateur local.
- Utilisez-les pour effectuer une connexion SSH à la machine virtuelle Notebook.
2019-09-03
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.60
Nouvelles fonctionnalités
- Ajout de FileDataset, qui fait référence à des fichiers uniques ou multiples dans vos magasins de fichiers ou vos URL publiques. Les fichiers peuvent être de n’importe quel format. FileDataset vous offre la possibilité de télécharger ou de monter les fichiers dans votre calcul.
- Ajout de la prise en charge du YAML de pipeline pour les étapes PythonScript, Adla, Databricks, DataTransfer et AzureBatch
Résolutions de bogue et améliorations
azureml-automl-core
- AutoArima est désormais un pipeline suggéré pour la préversion uniquement.
- Amélioration des rapports d’erreurs pour les prévisions.
- Amélioration de la journalisation à l’aide d’exceptions personnalisées plutôt que génériques dans les tâches de prévision.
- La vérification sur max_concurrent_iterations a été supprimée pour être inférieure au nombre total d’itérations.
- Les modèles AutoML retournent désormais AutoMLExceptions
- Cette version améliore les performances d’exécution des exécutions locales de Machine Learning automatisé.
azureml-core
- Ajoute Dataset.get_all(workspace), qui retourne un dictionnaire d'objets
TabularDataset
etFileDataset
indexés par nom d’inscription.
workspace = Workspace.from_config() all_datasets = Dataset.get_all(workspace) mydata = all_datasets['my-data']
Ajout de
parition_format
comme argument pourDataset.Tabular.from_delimited_files
etDataset.Tabular.from_parquet.files
. Les informations de partition de chaque chemin de données sont extraites dans des colonnes en fonction du format spécifié. « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateTime, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, la minute et la seconde pour le type DateTime. partition_format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, si l’on prend le chemin d’accès '../USA/2019/01/01/data.csv' où la partition se fait par pays/région et par heure, partition_format='/{Country}/{PartitionDate:yyyy/MM/dd}/data.csv' crée la colonne chaîne « Country » avec la valeur « USA » et la colonne DateTime « PartitionDate » avec la valeur « 2019-01-01 ».workspace = Workspace.from_config() all_datasets = Dataset.get_all(workspace) mydata = all_datasets['my-data']
Ajout de
partition_format
comme argument pourDataset.Tabular.from_delimited_files
etDataset.Tabular.from_parquet.files
. Les informations de partition de chaque chemin de données sont extraites dans des colonnes en fonction du format spécifié. « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateTime, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, la minute et la seconde pour le type DateTime. partition_format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, si l’on prend le chemin d’accès '../USA/2019/01/01/data.csv' où la partition se fait par pays/région et par heure, partition_format='/{Country}/{PartitionDate:yyyy/MM/dd}/data.csv' crée la colonne chaîne « Country » avec la valeur « USA » et la colonne DateTime « PartitionDate » avec la valeur « 2019-01-01 ».Les méthodes
to_csv_files
etto_parquet_files
ont été ajoutées àTabularDataset
. Ces méthodes permettent la conversion entreTabularDataset
etFileDataset
en convertissant les données en fichiers au format spécifié.Connectez-vous automatiquement au registre d’images de base lors de l’enregistrement d’un fichier Dockerfile généré par Model.package().
« gpu_support » n’est plus nécessaire ; AML détecte et utilise désormais automatiquement l’extension Docker Nvidia lorsqu’elle est disponible. Elle sera supprimée dans une version ultérieure.
Ajout de la prise en charge de la création, de la mise à jour et de l’utilisation de PipelineDrafts.
Cette version améliore les performances d’exécution des exécutions locales de Machine Learning automatisé.
Les utilisateurs peuvent interroger les métriques à partir de l’historique des exécutions par nom.
Amélioration de la journalisation à l’aide d’exceptions personnalisées plutôt que génériques dans les tâches de prévision.
- Ajoute Dataset.get_all(workspace), qui retourne un dictionnaire d'objets
azureml-explain-model
- Ajout du paramètre feature_maps au nouveau MimicWrapper, pour permettre aux utilisateurs d’obtenir des explications sur les fonctionnalités brutes.
- Les chargements de jeux de données sont maintenant désactivés par défaut pour le téléchargement d’explications et peuvent être réactivés avec upload_datasets=True
- Ajout de paramètres de filtrage « is_law » à la liste d’explications et aux fonctions de téléchargement.
- Ajoute la méthode
get_raw_explanation(feature_maps)
aux objets d’explication globaux et locaux. - Ajout de la vérification de version à lightgbm avec un avertissement imprimé si elle est inférieure à la version prise en charge
- Utilisation optimisée de la mémoire lors du traitement des explications par lots
- Les modèles AutoML retournent désormais AutoMLExceptions
azureml-pipeline-core
- Ajout de la prise en charge de la création, de la mise à jour et de l’utilisation de PipelineDrafts - peut servir à gérer les définitions de pipeline mutable et les utiliser de manière interactive pour exécuter
azureml-train-automl
- Création d’une fonctionnalité pour installer des versions spécifiques de pytorch v1.1.0, cuda Toolkit 9.0, pytorch-transformers compatibles avec les GPU, ce qui est nécessaire à l’activation de BERT/XLNet dans l’environnement du runtime Python distant.
azureml-train-core
- Échec précoce de certaines erreurs de définition d’espace hyperparamètre directement dans le Kit de développement logiciel (SDK) au lieu du côté serveur.
Kit de développement logiciel (SDK) de préparation de données Azure Machine Learning v1.1.14
- Résolutions de bogue et améliorations
- Activation de l’écriture dans ADLS/ADLSGen2 à l’aide du chemin d’accès brut et des informations d’identification.
- Correction d’un bogue à cause duquel
include_path=True
ne fonctionnait pas pourread_parquet
. - Résolution de l’échec
to_pandas_dataframe()
provoqué par l’exception « Valeur de propriété non valide : hostSecret ». - Correction d’un bogue dans lequel les fichiers ne pouvaient pas être lus sur DBFS en mode Spark.
19/08/2019
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.57
Nouvelles fonctionnalités
- Activation de
TabularDataset
pour consommation par AutomatedML. Pour en savoir plus surTabularDataset
, visitez https://aka.ms/azureml/howto/createdatasets..
- Activation de
Résolutions de bogue et améliorations
- azure-cli-ml
- Vous pouvez maintenant mettre à jour le certificat TLS/SSL pour le point de terminaison de score déployé sur le cluster AKS pour les certificats générés par Microsoft et par le client.
- azureml-automl-core
- Résolution d’un problème dans AutoML où les lignes avec des étiquettes manquantes ne sont pas correctement supprimées.
- Amélioration de la journalisation des erreurs dans AutoML. Les messages d’erreur complets seront désormais toujours écrits dans le fichier journal.
- AutoML a mis à jour son épinglage de package pour inclure
azureml-defaults
,azureml-explain-model
etazureml-dataprep
. AutoML n’avertit plus en cas d’incompatibilité de package (à l’exception du packageazureml-train-automl
). - Correction d’un problème dans
timeseries
où les fractionnements de cv sont de taille inégale, ce qui provoque l’échec du calcul des fichiers binaires. - Lors de l’exécution de l’ensemble d’itération pour le type d’apprentissage de validation croisée, si nous avons rencontré un problème lors du téléchargement des modèles formés sur l’ensemble du jeu de données, nous avons une incohérence entre la pondération des modèles et les modèles qui ont été intégrés à l’ensemble de vote.
- Correction de l’erreur déclenchée lorsque des étiquettes d’apprentissage et/ou de validation (y et y_valid) sont fournies sous la forme de trames de données Pandas, mais pas en tant que tableau numpy.
- Résolution du problème lié aux tâches de prévision quand Aucune a été trouvé dans les colonnes booléennes des tables d’entrée.
- Possibilité donnée aux utilisateurs AutoML de supprimer des séries d’entraînement qui ne sont pas suffisamment longues lors des prévisions. - Autoriser les utilisateurs AutoML à supprimer des grains du jeu de test qui n’existe pas dans le jeu d’apprentissage lors de la prévision.
- azureml-core
- Correction du problème de classement du paramètre blob_cache_timeout.
- Ajout des types d’exceptions d’ajustement externe et de transformation aux erreurs système.
- Ajout de la prise en charge des secrets Key Vault pour les exécutions distantes. Ajout d’une classe
azureml.core.keyvault.Keyvault
pour ajouter, obtenir et répertorier les secrets du coffre de clés associé à votre espace de travail. Opérations prises en charge :- azureml.core.workspace.Workspace.get_default_keyvault()
- azureml.core.keyvault.Keyvault.set_secret(name, value)
- azureml.core.keyvault.Keyvault.set_secrets(secrets_dict)
- azureml.core.keyvault.Keyvault.get_secret(name)
- azureml.core.keyvault.Keyvault.get_secrets(secrets_list)
- azureml.core.keyvault.Keyvault.list_secrets()
- Méthodes supplémentaires pour obtenir un coffre de clés par défaut et récupérer des secrets lors de l’exécution distante :
- azureml.core.workspace.Workspace.get_default_keyvault()
- azureml.core.run.Run.get_secret(name)
- azureml.core.run.Run.get_secrets(secrets_list)
- Ajout de paramètres de substitution supplémentaires à la commande submit-hyperdrive de l’interface CLI.
- Amélioration de la fiabilité des appels d’API pour étendre les nouvelles tentatives aux exceptions de la bibliothèque de demandes courantes.
- Ajout de la prise en charge de l’envoi des exécutions à partir d’une exécution envoyée.
- Correction du problème de jeton SAS arrivant à expiration dans FileWatcher, ce qui provoquait l’arrêt du chargement des fichiers après l’expiration de leur jeton initial.
- Prise en charge de l’importation des fichiers CSV/TSV HTTP dans le SDK Python du jeu de données.
- Méthode Workspace.Setup() déconseillée. Le message d’avertissement présenté aux utilisateurs suggère d’utiliser create() ou get()/from_config().
- Ajout de Environment.add_private_pip_wheel(), qui permet de charger des packages Python privés et personnalisés
whl
dans l’espace de travail et de les utiliser de manière sécurisée pour créer/matérialiser l’environnement. - Vous pouvez maintenant mettre à jour le certificat TLS/SSL pour le point de terminaison de score déployé sur le cluster AKS pour les certificats générés par Microsoft et par le client.
- azureml-explain-model
- Ajout d’un paramètre pour ajouter un ID de modèle aux explications lors du chargement.
- Ajout du balisage
is_raw
aux explications en mémoire et au chargement. - Ajout de la prise en charge et des tests pytorch pour le package azureml-explain-model.
- azureml-opendatasets
- Prise en charge de la détection et de la journalisation de l’environnement de test automatique.
- Ajout de classes pour obtenir la population des États-Unis par comté et par code postal.
- azureml-pipeline-core
- Ajout de la propriété label aux définitions de port d’entrée et de sortie.
- azureml-telemetry
- Correction de la configuration de télémétrie incorrecte.
- azureml-train-automl
- Correction du bogue à l’origine de l’échec de l’installation, l’erreur n’étant pas consignée dans le champ Erreurs de l’exécution et donc pas stockée dans le champ Erreurs du parent.
- Résolution d’un problème dans AutoML où les lignes avec des étiquettes manquantes ne sont pas correctement supprimées.
- Autoriser les utilisateurs AutoML à supprimer des séries d’apprentissage qui ne sont pas suffisamment longues lors des prévisions.
- Autoriser les utilisateurs AutoML à supprimer des grains du jeu de test qui n’existe pas dans le jeu d’apprentissage lors de la prévision.
- Désormais, AutoMLStep passe par la configuration
automl
à backend pour éviter tout problème concernant la modification ou l’ajout de paramètres de configuration. - AutoML Data Guardrail est désormais en préversion publique. L’utilisateur verra un rapport Data Guardrail (pour les tâches de classification/régression) après l’apprentissage et pourra également y accéder via l’API du SDK.
- azureml-train-core
- Ajout de la prise en charge de Torch 1.2 dans PyTorch Estimator.
- azureml-widgets
- Amélioration des graphiques de la matrice de confusion pour l’apprentissage de la classification.
- azure-cli-ml
Kit de développement logiciel (SDK) de préparation de données Azure Machine Learning v1.1.12
Nouvelles fonctionnalités
- Les listes de chaînes peuvent maintenant être passées comme entrée des méthodes
read_*
.
- Les listes de chaînes peuvent maintenant être passées comme entrée des méthodes
Résolutions de bogue et améliorations
- Les performances de
read_parquet
ont été améliorées lors de l’exécution dans Spark. - Résolution d’un problème en raison duquel
column_type_builder
échouait dans une colonne unique avec des formats de date ambigus.
- Les performances de
Portail Azure
- Fonctionnalité en préversion
- La diffusion en continu des fichiers journaux et des fichiers de sortie est désormais disponible pour les pages de détail de l’exécution. Ces fichiers envoient en streaming des mises à jour en temps réel lorsque l’aperçu est activé.
- La possibilité de définir un quota au niveau de l’espace de travail est publiée en version préliminaire. Les quotas AmlCompute sont alloués au niveau de l’abonnement, mais nous vous permettons désormais de distribuer ces quotas entre les espaces de travail et de les allouer pour un partage et une gouvernance équitables. Cliquez simplement sur le panneau Utilisations+quotas dans la barre de navigation de gauche de votre espace de travail, puis sélectionnez l’onglet Configurer les quotas. Vous devez être administrateur d’abonnement pour pouvoir définir des quotas au niveau de l’espace de travail, car il s’agit d’une opération qui a lieu sur les différents espaces de travail.
05-08-2019
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.55
Nouvelles fonctionnalités
- L’authentification basée sur des jetons est désormais prise en charge pour les appels établis vers le point de terminaison de scoring déployé sur AKS. Nous continuons de prendre en charge l’authentification par clé actuelle, et les utilisateurs peuvent utiliser un de ces mécanismes d’authentification à la fois.
- Possibilité d’inscrire un stockage blob situé derrière le réseau virtuel en tant que banque de données.
Résolutions de bogue et améliorations
- azureml-automl-core
- Corrige un bogue où la taille de validation pour les fractionnements CV est petite et entraîne des prédictions erronées par rapport aux graphiques réels pour la régression et la prévision.
- La journalisation des tâches de prévision sur les exécutions distantes a été améliorée. Désormais, l’utilisateur reçoit un message d’erreur complet en cas d’échec d’exécution.
- Correction d’échecs de
Timeseries
si la valeur de l’indicateur de prétraitement est True. - Messages d’erreur de validation des données de prévision rendus plus actionnables.
- Réduction de la consommation de mémoire des exécutions AutoML par la suppression ou le chargement différé de jeux de données, en particulier entre les déclenchements de processus
- azureml-contrib-explain-model
- Ajout de l’indicateur model_task aux explications afin de permettre à l’utilisateur de modifier la logique d’inférence automatique par défaut pour le type de modèle
- Modifications du widget : Installation automatique avec
contrib
, sans plus aucune installation/activation denbextension
– Explication de prise en charge avec l’importance globale de la fonctionnalité (par exemple, Permutative) - Modifications du tableau de bord : Tracés en boîte et en violon, en plus du tracé
beeswarm
sur la page de résumé – Réitération du rendu plus rapide du tracébeeswarm
en cas de déplacement du curseur « top-k » – Message utile expliquant le mode de calcul de top-k – Messages personnalisables utiles au lieu de graphiques en l’absence de données
- azureml-core
- Ajout de la méthode Model.package() pour créer des images Docker et des Dockerfiles qui encapsulent des modèles et leurs dépendances.
- Mise à jour des services web locaux pour accepter des InferenceConfigs contenant des objets Environnement.
- Model.Register() fixe produisant des modèles non valides quand ’.’ (pour le répertoire actif) est transmis en tant que paramètre model_path.
- Ajout de Run.submit_child. La fonctionnalité reflète Experiment.submit lors de la spécification de l’exécution en tant que parent de l’exécution enfant envoyée.
- Prise en charge des options de configuration de Model.Register dans Run.register_model.
- Possibilité d’exécuter des travaux JAR sur un cluster existant.
- Prise en charge des paramètres instance_pool_id et cluster_log_dbfs_path.
- Ajout de la prise en charge de l’utilisation d’un objet Environnement lors du déploiement d’un modèle sur un service web. L’objet Environnement peut désormais être fourni en tant que composant de l’objet InferenceConfig.
- Ajout de mappage appinsifht pour les nouvelles régions centralus - westus - northcentralus
- Ajout de documentation pour tous les attributs de toutes les classes de banque de données.
- Ajout du paramètre blob_cache_timeout à
Datastore.register_azure_blob_container
. - Ajout des méthodes save_to_directory et load_from_directory à azureml.core.environment.Environment.
- Ajout des commandes « az ml environment show » et « az ml environment list » à l’interface de ligne de commande.
- Ajout de la méthode Environment.add_private_pip_wheel.
- azureml-explain-model
- Ajout du suivi des jeux de données aux explications à l’aide du service de jeu de données (préversion).
- Réduction de la taille de lot par défaut lors de la diffusion en continu d’explications globales de 10 à 100 Ko.
- Ajout de l’indicateur model_task aux explications pour permettre à l’utilisateur de modifier la logique d’inférence automatique par défaut pour le type de modèle.
- azureml-mlflow
- Correction du bogue dans mlflow.azureml.build_image qui avait pour effet que des répertoires imbriqués étaient ignorés.
- azureml-pipeline-steps
- Ajout de la possibilité d’exécuter des travaux JAR sur un cluster Azure Databricks existant.
- Ajout de la prise en charge des paramètres instance_pool_id et cluster_log_dbfs_path pour l’étape DatabricksStep.
- Ajout de la prise en charge des paramètres de pipeline dans l’étape DatabricksStep.
- azureml-train-automl
- Ajout de
docstrings
pour les fichiers associés à l’ensemble. - Mise à jour de la documentation dans un langage plus approprié pour
max_cores_per_iteration
etmax_concurrent_iterations
- La journalisation des tâches de prévision sur les exécutions distantes a été améliorée. Désormais, l’utilisateur reçoit un message d’erreur complet en cas d’échec d’exécution.
- Suppression de get_data du bloc-notes
automlstep
du pipeline. - Début de la prise en charge
dataprep
dansautomlstep
.
- Ajout de
- azureml-automl-core
Kit de développement logiciel (SDK) v1.1.10 pour la préparation de données Azure Machine Learning
- Nouvelles fonctionnalités
- Vous pouvez maintenant demander d’exécuter des inspecteurs spécifiques (par exemple, histogramme, nuage de points, etc.) sur des colonnes spécifiques.
- Ajout d’un argument de parallélisation à
append_columns
. Si la valeur est True, les données sont chargées en mémoire, mais l’exécution se fait en parallèle. Si la valeur est False, l’exécution se fait en streaming, mais dans un thread unique.
2019-07-23
SDK Azure Machine Learning pour Python v1.0.53
Nouvelles fonctionnalités
- Le machine learning automatisé prend désormais en charge l’entraînement de modèles ONNX sur la cible de calcul distante.
- Azure Machine Learning offre maintenant la possibilité de reprendre l’entraînement à partir d’une exécution précédente, d’un point de contrôle ou de fichiers de modèle.
Résolutions de bogue et améliorations
- azure-cli-ml
- Les commandes CLI « model deploy » et « service update » acceptent désormais les paramètres, les fichiers de configuration ou une combinaison des deux. Les paramètres ont priorité sur les attributs des fichiers.
- La description du modèle peut désormais être mise à jour après l’inscription.
- azureml-automl-core
- Mise à jour de la dépendance NimbusML vers la version 1.2.0 (actuellement la version la plus récente)
- Ajout de la prise en charge des pipelines et des estimateurs ML Nimbus à utiliser dans les estimateurs AutoML.
- Correction d’un bogue dans la procédure de sélection d’ensemble qui ne faisait pas nécessairement croître l’ensemble résultant même si les scores restaient constants
- Possibilité de réutiliser certaines caractérisations dans les divisions de validation croisée pour les tâches de prévision. Ceci accélère l’exécution du programme d’installation avec un facteur approximatif de n_cross_validations pour les caractérisations coûteuses (décalages et fenêtres dynamiques, par exemple).
- Résolution d’un problème se produisant quand l’heure est hors de la plage horaire prise en charge par Pandas. Nous levons maintenant une exception DataException si l’heure est antérieure à pd.Timestamp.min ou postérieure à pd.Timestamp.max.
- La prévision autorise désormais des fréquences différentes dans les jeux d’entraînement et de test s’ils peuvent être alignés. Par exemple, « tous les trimestres à partir de janvier » et « tous les trimestres à partir d’octobre » peuvent être alignés.
- La propriété « parameters » a été ajoutée à TimeSeriesTransformer.
- Les anciennes classes d’exception ont été supprimées.
- Dans les tâches de prévision, le paramètre
target_lags
accepte désormais une valeur entière unique ou une liste d’entiers. Si l’entier est fourni, un seul décalage est créé. Si une liste est fournie, les valeurs uniques des décalages sont utilisées. target_lags=[1, 2, 2, 4] crée des décalages d’une, de deux et de quatre périodes. - Correction du bogue concernant la perte des types de colonnes après la transformation (bogue lié)
- Dans
model.forecast(X, y_query)
, possibilité pour y_query d’être un type d’objet débutant par « None(s) » (n° 459519). - Ajout des valeurs attendues à la sortie
automl
- azureml-contrib-datadrift
- Améliorations apportées à l’exemple de notebook, notamment le basculement vers azureml-opendatasets au lieu de azureml-contrib-opendatasets et amélioration des performances lors de l’enrichissement des données
- azureml-contrib-explain-model
- Correction de l’argument des transformations pour l’explicatif LIME pour l’importance des caractéristiques brutes dans le package azureml-contrib-explain-model
- Ajout de segmentations aux explications d’image dans l’explicatif d’image pour le package AzureML-contrib-explain-model
- Ajout d’une prise en charge partielle de SciPy pour LimeExplainer
- Ajout de
batch_size
pour imiter Explainer quandinclude_local=False
, pour diffuser en continu des explications globales par lots afin d’améliorer le temps d’exécution de DecisionTreeExplainableModel
- azureml-contrib-featureengineering
- Correction pour l’appel de set_featurizer_timeseries_params () : contrôle de valeur Null et modification du type de valeur dict - Ajout d’un notebook pour le caractériseur
timeseries
- Mise à jour de la dépendance NimbusML vers la version 1.2.0 (actuellement la version la plus récente)
- Correction pour l’appel de set_featurizer_timeseries_params () : contrôle de valeur Null et modification du type de valeur dict - Ajout d’un notebook pour le caractériseur
- azureml-core
- Ajout de la possibilité d’attacher des magasins de données DBFS dans l’interface CLI Azure Machine Learning
- Correction du bogue concernant le chargement des banques de données quand un dossier vide est créé si
target_path
commence par/
- Correction du problème avec
deepcopy
dans ServicePrincipalAuthentication. - Ajout des commandes « az ml environment show » et « az ml environment list » à l’interface CLI
- Les environnements prennent maintenant en charge la spécification d’un base_dockerfile comme alternative à un base_image déjà créé.
- Le paramètre RunConfiguration inutilisé dans auto_prepare_environment a été marqué comme déprécié.
- La description du modèle peut désormais être mise à jour après l’inscription.
- Résolution de bogue : Le modèle et la suppression d’image fournissent désormais plus d’informations sur la récupération des objets en amont qui en dépendent en cas d’échec de la suppression en raison d’une dépendance amont.
- Correction du bogue entraînant l’impression d’une durée vide pour les déploiements lors de la création d’un espace de travail pour certains environnements
- Amélioration des exceptions d’échec pour la création d’espace de travail. Les utilisateurs ne voient plus le message « Impossible de créer l’espace de travail. Impossible de trouver... ». Ils voient désormais l’échec de création réel.
- Ajout de la prise en charge de l’authentification de jeton dans les services web AKS
- Ajout de la méthode
get_token()
aux objetsWebservice
- Ajout de la prise en charge de l’interface CLI pour gérer les jeux de données de machine learning
- Désormais,
Datastore.register_azure_blob_container
utilise une valeurblob_cache_timeout
(en secondes) qui configure les paramètres de montage de Blobfuse pour activer l’expiration du cache pour cette banque de données. Par défaut, aucun délai d’expiration n’est appliqué : quand un objet blob est lu, il reste dans le cache local jusqu’à ce que le travail soit terminé. Ce paramètre est préférable pour la plupart des travaux, mais certains travaux doivent lire plus de données d’un jeu de données volumineux que ne peuvent l’accepter leurs nœuds. Le réglage de ce paramètre favorise la réussite de ces travaux. Soyez vigilant lors de la définition de ce paramètre : une valeur trop faible peut altérer les performances, car les données utilisées à une époque peuvent expirer avant d’être réutilisées. Toutes les lectures sont effectuées à partir du Stockage Blob ou du réseau, et non du cache local, ce qui a un impact négatif sur les durées d’entraînement. - La description du modèle peut désormais être mise à jour correctement après l’inscription.
- Lors de la suppression de modèle et d’image, de plus amples informations sont désormais fournies concernant les objets en amont qui en dépendent, entraînant l’échec de la suppression.
- Utilisation améliorée des ressources des exécutions à distance qui utilisent azureml.mlflow
- azureml-explain-model
- Correction de l’argument des transformations pour l’explicatif LIME pour l’importance des caractéristiques brutes dans le package azureml-contrib-explain-model
- Ajout d’une prise en charge partielle de SciPy pour LimeExplainer
- Ajout d’un wrapper explicatif linéaire de forme et d’un autre niveau à l’explicatif tabulaire pour l’explication des modèles linéaires
- Pour l’explicatif d’imitation dans la bibliothèque de modèles d’explication, correction de l’erreur avec include_local = false pour l’entrée de données éparses
- Ajout des valeurs attendues à la sortie
automl
- Correction de l’importance des caractéristiques par permutation quand l’argument des transformations est fourni pour bénéficier de l’importance des caractéristiques brutes
- Ajout de
batch_size
à reproduire quandinclude_local=False
pour le streaming d’explications globales par lots afin d’améliorer le temps d’exécution de DecisionTreeExplainableModel - Pour la bibliothèque d’explicabilité de modèle, correction des explicatifs de boîte noire quand l’entrée de dataframes Pandas est nécessaire pour la prédiction
- Correction du bogue suivant :
explanation.expected_values
retourne parfois une valeur flottante plutôt qu’une liste avec une valeur flottante.
- azureml-mlflow
- Amélioration du niveau de performance de mlflow.set_experiment(experiment_name)
- Correction du bogue concernant l’utilisation d’InteractiveLoginAuthentication pour le tracking_uri mlflow
- Utilisation améliorée des ressources des exécutions à distance qui utilisent azureml.mlflow
- Amélioration de la documentation du package azureml-mlflow
- Correction du bogue suivant : mlflow.log_artifacts (« my_dir ») enregistrait les artefacts sous
my_dir/<artifact-paths>
au lieu de<artifact-paths>
.
- azureml-opendatasets
- Ajout de la possibilité d’épingler
pyarrow
deopendatasets
aux anciennes versions (< 0.14.0) en raison d’un problème de mémoire. - Déplacement d’azureml-contrib-opendatasets vers azureml-opendatasets.
- Les classes de jeu de données ouvertes peuvent être inscrites auprès de l’espace de travail Azure Machine Learning et utiliser des fonctionnalités de jeu de données AML en toute fluidité.
- L’amélioration de NoaaIsdWeather enrichie sensiblement les performances de la version non SPARK.
- Ajout de la possibilité d’épingler
- azureml-pipeline-steps
- La banque de données DBFS est maintenant prise en charge pour les entrées et les sorties dans DatabricksStep.
- Mise à jour de la documentation d’Azure Batch Step concernant les entrées/sorties.
- Dans AzureBatchStep, modification de la valeur par défaut delete_batch_job_after_finish sur true.
- azureml-telemetry
- Déplacement d’azureml-contrib-opendatasets vers azureml-opendatasets.
- Les classes de jeu de données ouvertes peuvent être inscrites auprès de l’espace de travail Azure Machine Learning et utiliser des fonctionnalités de jeu de données AML en toute fluidité.
- L’amélioration de NoaaIsdWeather enrichie sensiblement les performances de la version non SPARK.
- azureml-train-automl
- Mise à jour de la documentation concernant get_output pour refléter le type de retour réel et fournir d’autres informations sur la récupération des propriétés de clé.
- Mise à jour de la dépendance NimbusML vers la version 1.2.0 (actuellement la version la plus récente)
- Ajout des valeurs attendues à la sortie
automl
- azureml-train-core
- Les chaînes sont maintenant acceptées en tant que cible de calcul pour le paramétrage automatisé des hyperparamètres.
- Le paramètre RunConfiguration inutilisé dans auto_prepare_environment a été marqué comme déprécié.
- azure-cli-ml
SDK de préparation de données Azure Machine Learning v1.1.9
Nouvelles fonctionnalités
- Ajout de la prise en charge de la lecture de fichier directement à partir d’une URL http ou https
Résolutions de bogue et améliorations
- Amélioration du message d’erreur affiché lors d’une tentative de lecture d’un jeu de données Parquet à partir d’une source distante (qui n’est pas encore prise en charge)
- Correction d’un bogue se produisant lors de l’écriture vers le format de fichier Parquet dans ADLS Gen 2 et de la mise à jour du nom de conteneur ADLS Gen 2 dans le chemin.
2019-07-09
Interface visuelle
- Fonctionnalités préliminaires
- Ajout du module « Exécuter le script R » dans l’interface visuelle.
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.48
Nouvelles fonctionnalités
- azureml-opendatasets
- azureml-contrib-opendatasets est maintenant disponible en tant que azureml-opendatasets. L’ancien package peut continuer à fonctionner, mais nous vous recommandons d’utiliser azureml-opendatasets pour des fonctionnalités et des améliorations plus riches.
- Ce nouveau package vous permet d’inscrire des jeux de données ouverts en tant que jeu de données dans un espace de travail Azure Machine Learning et d’utiliser des fonctionnalités offertes par le jeu de données.
- Il comprend également des fonctionnalités existantes, telles que l’utilisation de jeux de données ouverts en tant que dataframes Pandas/SPARK et les jointures d’emplacement pour certains jeux de données tels que la météo.
- azureml-opendatasets
Fonctionnalités préliminaires
- HyperDriveConfig peut désormais accepter l’objet de pipeline en tant que paramètre pour prendre en charge l’hyperparamètres à l’aide d’un pipeline.
Résolutions de bogue et améliorations
- azureml-train-automl
- Correction du bogue concernant la perte des types de colonnes après la transformation.
- Correction du bogue pour permettre à y_query d’être un type d’objet débutant par « Aucun(s) ».
- Correction du problème dans la procédure de sélection d’ensemble qui ne faisait pas nécessairement croître l’ensemble résultant même si les scores sont restés constants.
- Correction de problème avec les paramètres allow list_models ET block list_models dans AutoMLStep.
- Correction du problème qui empêchait l’utilisation du prétraitement quand AutoML était utilisé dans le contexte des pipelines Azure Machine Learning.
- azureml-opendatasets
- Déplacement d’azureml-contrib-opendatasets vers azureml-opendatasets.
- Les classes de jeu de données ouvertes peuvent être inscrites auprès de l’espace de travail Azure Machine Learning et utiliser des fonctionnalités de jeu de données AML en toute fluidité.
- Les NoaaIsdWeather améliorées enrichissent sensiblement les performances de la version non SPARK.
- azureml-explain-model
- Mise à jour de la documentation en ligne des objets d’interprétation.
- Ajout de
batch_size
à reproduire lorsqueinclude_local=False
pour le streaming d’explications globales par lots afin d’améliorer le temps d’exécution de DecisionTreeExplainableModel pour la bibliothèque d’optimisation des modèles. - Correction du problème où
explanation.expected_values
retourne parfois une valeur flottante plutôt qu’une liste avec une valeur flottante. - Ajout des valeurs attendues à la sortie
automl
pour reproduire l’imitateur dans l’explication du modèle de bibliothèque. - Correction de la fonctionnalité de permutation lorsque l’argument des transformations est fourni pour bénéficier de l’importance des fonctionnalités brutes.
- azureml-core
- Ajout de la possibilité d’attacher des magasins de données DBFS dans l’interface CLI Azure Machine Learning.
- Correction du problème de chargement des magasins de stockage lorsqu’un dossier vide a été créé si
target_path
commençait par/
. - Activation de la comparaison des deux jeux de données.
- Le modèle et la suppression d’image fournissent désormais plus d’informations sur la récupération des objets en amont qui en dépendent en cas d’échec de la suppression en raison d’une dépendance amont.
- Le paramètre RunConfiguration inutilisé dans auto_prepare_environment a été déconseillé.
- azureml-mlflow
- Utilisation améliorée des ressources des exécutions à distance qui utilisent azureml.mlflow.
- Amélioration de la documentation du package azureml-mlflow.
- Correction du problème où mlflow.log_artifacts (« my_dir ») enregistrait les artefacts sous « my_dir/artefact-paths » au lieu de « artefact-paths ».
- azureml-pipeline-core
- Le paramètre hash_paths pour toutes les étapes de pipeline est déconseillé et sera supprimé à l’avenir. Par défaut, le contenu de source_directory est haché (à l’exception des fichiers listés dans
.amlignore
ou.gitignore
) - L’amélioration continue de Module et de ModuleStep pour prendre en charge des modules de calcul spécifiques, en préparation de l’intégration de RunConfiguration et de modifications supplémentaires pour déverrouiller l’utilisation de modules de calcul spécifiques dans les pipelines.
- Le paramètre hash_paths pour toutes les étapes de pipeline est déconseillé et sera supprimé à l’avenir. Par défaut, le contenu de source_directory est haché (à l’exception des fichiers listés dans
- azureml-pipeline-steps
- AzureBatchStep : documentation améliorée sur les entrées/sorties.
- AzureBatchStep : modification de la valeur par défaut delete_batch_job_after_finish sur true.
- azureml-train-core
- Les chaînes sont maintenant acceptées en tant que cible de calcul pour le paramétrage automatisé des hyperparamètres.
- Le paramètre RunConfiguration inutilisé dans auto_prepare_environment a été déconseillé.
- Paramètres déconseillés
conda_dependencies_file_path
etpip_requirements_file_path
en faveur deconda_dependencies_file
etpip_requirements_file
, respectivement.
- azureml-opendatasets
- L’amélioration de NoaaIsdWeather enrichie sensiblement les performances de la version non SPARK.
- azureml-train-automl
2019-04-26
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.33.
- Les Modèles accélérés matériellement d’Azure Machine Learning sur FPGA sont en disponibilité générale.
- Vous pouvez à présent utiliser le package azureml-acceleration-models à :
- Former les poids d’un réseau neuronal profond pris en charge (ResNet 50, ResNet 152, DenseNet-121, VGG-16, et SSD-VGG)
- Utiliser l’apprentissage par transfert avec le réseau neuronal profond pris en charge
- Inscrire le modèle avec le Service Gestion des modèles et conteneuriser le modèle
- Déployer le modèle sur une machine virtuelle Azure avec un FPGA dans un cluster Azure Kubernetes Service (AKS)
- Déployer le conteneur dans un appareil de serveur Azure Stack Edge
- Noter vos données avec le point de terminaison gRPC avec cet exemple
- Vous pouvez à présent utiliser le package azureml-acceleration-models à :
Machine Learning automatisé
Fonctionnalités de balayage pour activer l’ajout dynamique de featurizers pour optimiser les performances. Nouveaux featurizers : utiliser les incorporations, poids de preuve, les encodages de cible, le codage de texte cible, la distance de cluster
CV intelligent pour gérer des fractions train/valid à l’intérieur de ML automatisé
Quelques modifications de l’optimisation de mémoire et amélioration des performances de runtime
Amélioration des performances dans l’explication de modèle
Conversion de modèle ONNX pour l’exécution locale
Prise en charge Subsampling
Arrêt intelligent quand aucun critère de sortie n’est défini
Ensembles empilés
Prévision de séries chronologiques
- Nouvelle fonction de prévision
- Vous pouvez maintenant utiliser la validation croisée d’origine propagée sur les données de séries chronologiques
- Nouvelles fonctionnalités ajoutées pour configurer les séries chronologiques en retard
- Nouvelles fonctionnalités ajoutées pour prendre en charge des fonctionnalités de regroupement de la fenêtre propagée
- Nouvelle détection de vacances et préapprentissage lorsque le code de pays/région est défini dans les paramètres d’expérience
Azure Databricks
- Capacité de prévision des séries chronologiques et d’interprétabilité/explication de modèle activée
- Vous pouvez désormais annuler et reprendre (continuer) des expériences de Machine Learning automatisé
- Ajout de la prise en charge pour le traitement multicœur
MLOps
Déploiement local et débogage des conteneurs de scoring
Vous pouvez désormais déployer un modèle ML localement et itérer rapidement sur votre fichier de scoring et vos dépendances pour vérifier qu’ils se comportent comme prévu.Introduction de InferenceConfig et Model.deploy()
Le modèle de déploiement prend maintenant en charge la spécification d’un dossier source avec un script d’entrée, identique à un Runconfig. En outre, le déploiement de modèle a été simplifié à une seule commande.Suivi de référence Git
Les clients demandent des fonctionnalités d’intégration Git de base depuis un moment, car elles contribuent à conserver une piste d’audit complète. Nous avons implémenté le suivi dans les entités principales dans Azure Machine Learning pour les métadonnées liées à Git (dépôt, commit, état propre). Ces informations seront collectées automatiquement par le Kit de développement logiciel et l’interface CLI.Service de profilage et de validation de modèle
Les clients se plaignent souvent de la difficulté à dimensionner correctement le calcul associé à leur service d’inférence. Avec notre service de profilage de modèle, le client peut donner des exemples d’entrées et nous établissons le profil entre 16 configurations de processeur / mémoire différentes afin de déterminer le dimensionnement optimal pour le déploiement.Apportez votre propre image de base pour l’inférence
Une autre critique courante a été la difficulté de déplacement de l’expérimentation aux dépendances de partage RE de l’inférence. Avec notre nouvelle capacité de partage d’image de base, vous pouvez maintenant réutiliser vos images de base d’expérimentation, les dépendances, etc, pour l’inférence. Cela devrait accélérer les déploiements et réduire l’écart de la boucle interne à la boucle externe.Expérience de génération de schéma Swagger améliorée
Notre méthode de génération Swagger était sujette à erreurs et était impossible à automatiser. Nous avons une nouvelle façon plus adaptée de générer des schémas swagger à partir de n’importe quelle fonction Python via des éléments décoratifs. Nous avons mis ce code en open source et notre protocole de génération de schéma n’est pas couplé à la plateforme Azure Machine Learning.L’interface CLI Azure Machine Learning est en disponibilité générale (GA)
Les modèles peuvent désormais être déployés avec une seule commande CLI. D’après des retours courants de nos clients, personne ne déploie de modèle ML depuis un notebook Jupyter. La documentation de référence CLI a été mise à jour.
2019-04-22
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.30.
Le PipelineEndpoint
a été introduit pour ajouter une nouvelle version d’un pipeline publié tout en conservant le même point de terminaison.
2019-04-15
Portail Azure
- Vous pouvez désormais renvoyer un script existant exécuté sur un cluster de calcul distant.
- Vous pouvez maintenant exécuter un pipeline publié avec les nouveaux paramètres sous l’onglet Pipelines.
- Les détails de l’exécution prennent désormais en charge une nouvelle visionneuse de fichier d’instantané. Vous pouvez afficher un instantané du répertoire lorsque vous avez envoyé une exécution spécifique. Vous pouvez également télécharger le notebook qui a été envoyé pour démarrer l’exécution.
- Vous pouvez désormais annuler les exécutions parentes à partir du portail Azure.
2019-04-08
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.23
- Nouvelles fonctionnalités
- Le kit de développement logiciel (SDK) Azure Machine Learning prend maintenant en charge Python 3.7.
- Les estimateurs de réseau neuronal profond d’Azure Machine Learning offre désormais une prise en charge multiversion intégrée. Par exemple, l’estimateur
TensorFlow
accepte désormais un paramètreframework_version
et les utilisateurs peuvent spécifier la version « 1.10 » ou « 1.12 ». Pour obtenir la liste des versions prises en charge par votre version du kit de développement logiciel actuelle, appelezget_supported_versions()
sur la classe souhaitée de l’infrastructure .NET (par exemple,TensorFlow.get_supported_versions()
). Pour obtenir la liste des versions prises en charge par la dernière version du Kit de développement logiciel, consultez la documentation sur l’estimateur du réseau neuronal profond.
2019-03-25
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.21
- Nouvelles fonctionnalités
- La méthode azureml.core.Run.create_children permet de créer une faible latence de plusieurs exécutions enfants avec un seul appel.
2019-03-11
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.18
- Modifications
- Le package azureml-tensorboard remplace azureml-contrib-tensorboard.
- Avec cette version, vous pouvez configurer un compte d’utilisateur sur votre cluster de calcul géré (amlcompute), lors de sa création. Cela est possible en passant ces propriétés dans la configuration de l’approvisionnement. Vous pouvez trouver plus d’informations dans la documentation sur la référence du kit de développement logiciel (SDK).
Kit de développement logiciel (SDK) de préparation de données Azure Machine Learning v1.0.17
Nouvelles fonctionnalités
- Prend désormais en charge l’ajout de deux colonnes numériques pour générer une colonne résultante en utilisant le langage d’expression.
Résolutions de bogue et améliorations
- Amélioration de la documentation et de la vérification des paramètres de random_split.
2019-02-27
Kit de développement logiciel (SDK) de préparation de données Azure Machine Learning v1.0.16
- Résolution de bogue
- Correction d’un problème d’authentification au principal de service causé par une modification de l’API.
2019-02-25
Kit de développement logiciel (SDK) Azure Machine Learning pour Python v1.0.17
Nouvelles fonctionnalités
- Azure Machine Learning fournit désormais une prise en charge de première classe pour le Chainer de l’infrastructure de réseau neuronal profond populaire. À l’aide des classes
Chainer
, les utilisateurs peuvent facilement former et déployer des modèles Chainer. - Ajout de la capacité des pipelines Azure Machine Learning à déclencher une exécution de pipeline en fonction des modifications apportées au magasin de données. Le pipeline notebook de planification est mis à jour afin de tirer parti de cette fonctionnalité.
- Azure Machine Learning fournit désormais une prise en charge de première classe pour le Chainer de l’infrastructure de réseau neuronal profond populaire. À l’aide des classes
Résolutions de bogue et améliorations
- Nous avons ajouté la prise en charge des pipelines Azure Machine Learning pour définir la propriété source_directory_data_store sur un magasin de données de votre choix (par exemple, un stockage d’objets blob) dans des RunConfigurations qui sont fournies dans PythonScriptStep. Par défaut, les étapes utilisent le stockage Fichier Azure comme banque de données de secours, ce qui peut entraîner des problèmes de limitation de bande passante lorsqu’un grand nombre d’étapes sont exécutées en même temps.
Portail Azure
- Nouvelles fonctionnalités
- Nouvelle expérience glisser-déposer pour les rapports. Les utilisateurs peuvent faire glisser une colonne de la zone de configuration à la zone de la table où s’affiche un aperçu de la table. Les colonnes peuvent être déplacées.
- Nouvelle visionneuse de fichiers journaux
- Liens vers exécution d’expériences, calcul, modèles, images et déploiements à partir de l’onglet activités
Étapes suivantes
Consultez la vue d’ensemble d’Azure Machine Learning.