Migrer la journalisation du SDK v1 vers SDK v2

Article
12/20/2024

Azure Machine Learning utilise MLflow Tracking pour la journalisation des métriques et le stockage d’artefacts pour vos expériences, que vous ayez créé l’expérience via le SDK Python Azure Machine Learning, l’interface CLI Azure Machine Learning ou Azure Machine Learning studio. Nous vous recommandons d’utiliser MLflow pour les expériences de suivi.

Si vous migrez du SDK v1 vers le SDK v2, utilisez les informations de cette section pour comprendre les équivalents MLflow des API de journalisation du SDK v1.

Pourquoi MLflow ?

Avec plus de 13 millions de téléchargements mensuels, MLflow est devenu la plateforme standard pour les MLOps de bout en bout : il permet aux équipes de toute taille de suivre, partager, empaqueter et déployer n’importe quel modèle pour l’inférence par lots ou en temps réel. Azure Machine Learning s’intègre à MLflow. Cela vous permet d’obtenir un code d’entraînement disposant d’une véritable portabilité et s’intégrant de façon transparente à d’autres plateformes, car il ne contient pas d’instructions spécifiques à Azure Machine Learning.

Préparer la migration vers MLflow

Pour utiliser le suivi MLflow, vous devez installer le package SDK MLflowmlflow et le plug-in Azure Machine Learning pour MLflow azureml-mlflow. Tous les environnements Azure Machine Learning mettent déjà ces packages à votre disposition, mais vous devez les inclure si vous créez votre propre environnement.

pip install mlflow azureml-mlflow

Se connecter à un espace de travail

Azure Machine Learning permet aux utilisateurs de suivre les travaux d’entraînement exécutés sur votre espace de travail ou exécutés à distance (suivi d’expériences exécutées en dehors d’Azure Machine Learning). Si vous effectuez un suivi à distance, vous devez indiquer l’espace de travail auquel vous souhaitez connecter MLflow.

Capacité de calcul Azure Machine Learning
Calcul distant

Vous êtes déjà connecté à votre espace de travail quand l’exécution s’effectue dans la capacité de calcul Azure Machine Learning.

Configurer l’URI de suivi

Récupérez l’URI de suivi pour votre espace de travail :
S’APPLIQUE À : Extension Azure CLI ml v2 (actuelle)
1. Connectez-vous et configurez votre espace de travail :
```
az account set --subscription <subscription-ID>
az configure --defaults workspace=<workspace-name> group=<resource-group-name> location=<location> 
```
2. Obtenez l’URI de suivi à l’aide de la az ml workspace commande :
```
az ml workspace show --query mlflow_tracking_uri
```
S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

Vous pouvez utiliser le Kit de développement logiciel (SDK) Azure Machine Learning v2 pour Python pour obtenir l’URI de suivi MLflow Azure Machine Learning. Vérifiez que la azure-ai-ml bibliothèque est installée dans votre instance de calcul. Utilisez ensuite le code suivant pour obtenir l’URI de suivi MLFLow unique associé à votre espace de travail.
1. Utilisez une instance de connexion à votre espace de MLClient travail. Il existe deux options pour la connexion :
  - Le moyen le plus simple consiste à utiliser le fichier de configuration de l’espace de travail :
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential ml_client = MLClient.from_config(credential=DefaultAzureCredential())
    
    Conseil
    
    Vous pouvez télécharger le fichier de configuration de l’espace de travail en procédant comme suit :
    
    Accédez à Azure Machine Learning Studio.
    
    Dans le coin supérieur droit, sélectionnez le nom de votre espace de travail.
    
    Dans la fenêtre Répertoire + Abonnement + Espace de travail, sélectionnez Télécharger le fichier de configuration.
    
    Enregistrez le fichier config.json dans le répertoire dans lequel vous travaillez.
  - Vous pouvez également utiliser votre ID d’abonnement, le nom du groupe de ressources et le nom de l’espace de travail pour vous connecter :
    
    from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential # Enter information about your Azure Machine Learning workspace. subscription_id = "<subscription-ID>" resource_group = "<resource-group-name>" workspace_name = "<workspace-name>" ml_client = MLClient(credential=DefaultAzureCredential(), subscription_id=subscription_id, resource_group_name=resource_group, workspace_name=workspace_name)
    
    Important
    
    La DefaultAzureCredential méthode tente d’extraire les informations d’identification du contexte disponible. Toutefois, vous pouvez spécifier des informations d’identification de manière différente, par exemple en utilisant le navigateur web de manière interactive. Dans ces cas, vous pouvez utiliser InteractiveBrowserCredential ou toute autre méthode disponible dans le azure.identity package.
2. Obtenez l’URI de suivi Azure Machine Learning :
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Utilisez Azure Machine Learning Studio pour obtenir l’URI de suivi :
1. Ouvrez Azure Machine Learning Studio et utilisez vos informations d’identification pour vous connecter.
2. Dans le coin supérieur droit, sélectionnez le nom de votre espace de travail.
3. Dans la fenêtre Annuaire + Abonnement + Espace de travail, sélectionnez Afficher toutes les propriétés dans le portail Azure. La page de ressources de votre espace de travail s’ouvre dans le Portail Azure.
4. Sous Essentials, copiez la valeur de l’URI de suivi MLflow.
Vous pouvez construire manuellement l’URI de suivi Azure Machine Learning. Vous avez besoin de votre ID d’abonnement, de la région dans laquelle votre espace de travail est déployé, du nom de votre groupe de ressources et du nom de votre espace de travail. Pour obtenir l’URI, entrez ces valeurs dans le code suivant :

Avertissement

Si vous utilisez un espace de travail avec liaison privée, le point de terminaison MLflow utilise également une liaison privée pour communiquer avec Azure Machine Learning. Par conséquent, l’URI de suivi utilise un format différent de celui de cet article. Dans ce cas, vous devez utiliser le Kit de développement logiciel (SDK) Azure Machine Learning pour Python ou Azure Machine Learning CLI v2 pour obtenir l’URI de suivi.
```
region = "<region>"
subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace_name = "<workspace-name>"

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Configurez l’URI de suivi :
- Kit de développement logiciel (SDK) MLflow
- Variables d’environnement
Utilisez la set_tracking_uri() méthode pour définir l’URI de suivi MLflow sur l’URI de suivi de votre espace de travail.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Dans votre instance de calcul, utilisez le code suivant pour définir la MLFLOW_TRACKING_URI variable d’environnement MLflow sur l’URI de suivi de votre espace de travail. Cette affectation rend toutes les interactions avec MLflow dans cette instance de calcul pointent vers Azure Machine Learning par défaut. Pour plus d’informations, consultez Fonctions de journalisation.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Conseil

Certains scénarios impliquent l’utilisation d’un environnement partagé comme un cluster Azure Databricks ou un cluster Azure Synapse Analytics. Dans ces cas, il est utile de définir la MLFLOW_TRACKING_URI variable d’environnement au niveau du cluster plutôt que pour chaque session. La définition de la variable au niveau du cluster configure automatiquement l’URI de suivi MLflow pour qu’elle pointe vers Azure Machine Learning pour toutes les sessions du cluster.

Configurer l’authentification

Quand le suivi est configuré, vous devez également configurer le mode d’authentification auprès de l’espace de travail associé. Par défaut, le plug-in Azure Machine Learning pour MLflow effectue une authentification interactive en ouvrant le navigateur par défaut pour demander les informations d’identification. Consultez Configurer MLflow pour Azure Machine Learning : Configurer l’authentification pour connaître d’autres moyens de configurer l’authentification pour MLflow auprès des espaces de travail Azure Machine Learning.

Pour les travaux interactifs où un utilisateur est connecté à la session, vous pouvez vous appuyer sur l’authentification interactive. Aucune autre action n’est requise.

Avertissement

L’authentification interactive par navigateur bloque l’exécution du code quand les informations d’identification sont demandées. Cette approche ne convient pas à l’authentification dans les environnements non surveillés, par exemple pour les travaux d’entraînement. Nous vous recommandons de configurer un mode d’authentification différent dans ces environnements.

Pour les scénarios nécessitant une exécution sans assistance, vous devez configurer un principal de service pour communiquer avec Azure Machine Learning. Pour plus d’informations sur la création d’un principal de service, consultez Configurer un principal de service.

Utilisez l’ID de locataire, l’ID client et la clé secrète client de votre principal de service dans le code suivant :

Kit de développement logiciel (SDK) MLflow
Variables d’environnement

import os

os.environ["AZURE_TENANT_ID"] = "<Azure-tenant-ID>"
os.environ["AZURE_CLIENT_ID"] = "<Azure-client-ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<Azure-client-secret>"

export AZURE_TENANT_ID="<Azure-tenant-ID>"
export AZURE_CLIENT_ID="<Azure-client-ID>"
export AZURE_CLIENT_SECRET="<Azure-client-secret>"

Conseil

Lorsque vous travaillez dans des environnements partagés, nous vous recommandons de configurer ces variables d’environnement au niveau du calcul. Une meilleure pratique consiste à les gérer comme secrets dans une instance d’Azure Key Vault.

Par exemple, dans une configuration de cluster Azure Databricks, vous pouvez utiliser des secrets dans les variables d’environnement de la manière suivante : AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Pour plus d’informations sur l’implémentation de cette approche dans Azure Databricks, consultez Référencer un secret dans une variable d’environnement ou reportez-vous à la documentation de votre plateforme.

Expériences et exécutions

SDK v1

from azureml.core import Experiment

# create an Azure Machine Learning experiment and start a run
experiment = Experiment(ws, "create-experiment-sdk-v1")
azureml_run = experiment.start_logging()

SDK v2 avec MLflow

# Set the MLflow experiment and start a run
mlflow.set_experiment("logging-with-mlflow")
mlflow_run = mlflow.start_run()

Comparaison des API de journalisation

Journaliser une métrique de type entier ou float

SDK v1

azureml_run.log("sample_int_metric", 1)

SDK v2 avec MLflow

mlflow.log_metric("sample_int_metric", 1)

Journaliser une métrique booléenne

SDK v1

azureml_run.log("sample_boolean_metric", True)

SDK v2 avec MLflow

mlflow.log_metric("sample_boolean_metric", 1)

Journaliser une métrique de chaîne

SDK v1

azureml_run.log("sample_string_metric", "a_metric")

SDK v2 avec MLflow

mlflow.log_text("sample_string_text", "string.txt")

La chaîne est journalisée en tant qu’artefact, et non en tant que métrique. Dans Azure Machine Learning Studio, la valeur s’affiche sous l’onglet Sorties + journaux.

Journaliser une image dans un fichier PNG ou JPEG

SDK v1

azureml_run.log_image("sample_image", path="Azure.png")

SDK v2 avec MLflow

mlflow.log_artifact("Azure.png")

L’image est enregistrée en tant qu’artefact et apparaît sous l’onglet Images dans Azure Machine Learning Studio.

Journaliser un matplotlib.pyplot

SDK v1

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
azureml_run.log_image("sample_pyplot", plot=plt)

SDK v2 avec MLflow

import matplotlib.pyplot as plt

plt.plot([1, 2, 3])
fig, ax = plt.subplots()
ax.plot([0, 1], [2, 3])
mlflow.log_figure(fig, "sample_pyplot.png")

L’image est enregistrée en tant qu’artefact et apparaît sous l’onglet Images dans Azure Machine Learning Studio.

Journaliser une liste des métriques

SDK v1

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
azureml_run.log_list('sample_list', list_to_log)

SDK v2 avec MLflow

list_to_log = [1, 2, 3, 2, 1, 2, 3, 2, 1]
from mlflow.entities import Metric
from mlflow.tracking import MlflowClient
import time

metrics = [Metric(key="sample_list", value=val, timestamp=int(time.time() * 1000), step=0) for val in list_to_log]
MlflowClient().log_batch(mlflow_run.info.run_id, metrics=metrics)

Les métriques apparaissent sous l’onglet Métriques dans Azure Machine Learning studio.
Les valeurs de texte ne sont pas prises en charge.

Journaliser une ligne de métriques

SDK v1

azureml_run.log_row("sample_table", col1=5, col2=10)

SDK v2 avec MLflow

metrics = {"sample_table.col1": 5, "sample_table.col2": 10}
mlflow.log_metrics(metrics)

Les métriques ne s’affichent pas en tant que table dans Azure Machine Learning studio.
Les valeurs de texte ne sont pas prises en charge.
Journalisé en tant qu’artefact, et non en tant que métrique.

Journaliser une table

SDK v1

table = {
"col1" : [1, 2, 3],
"col2" : [4, 5, 6]
}
azureml_run.log_table("table", table)

SDK v2 avec MLflow

# Add a metric for each column prefixed by metric name. Similar to log_row
row1 = {"table.col1": 5, "table.col2": 10}
# To be done for each row in the table
mlflow.log_metrics(row1)

# Using mlflow.log_artifact
import json

with open("table.json", 'w') as f:
json.dump(table, f)
mlflow.log_artifact("table.json")

Journalise des métriques pour chaque colonne.
Les métriques ne s’affichent pas en tant que table dans Azure Machine Learning studio.
Les valeurs de texte ne sont pas prises en charge.
Journalisé en tant qu’artefact, et non en tant que métrique.

Journaliser un table de précision

SDK v1

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

azureml_run.log_accuracy_table('v1_accuracy_table', ACCURACY_TABLE)

SDK v2 avec MLflow

ACCURACY_TABLE = '{"schema_type": "accuracy_table", "schema_version": "v1", "data": {"probability_tables": ' +\
        '[[[114311, 385689, 0, 0], [0, 0, 385689, 114311]], [[67998, 432002, 0, 0], [0, 0, ' + \
        '432002, 67998]]], "percentile_tables": [[[114311, 385689, 0, 0], [1, 0, 385689, ' + \
        '114310]], [[67998, 432002, 0, 0], [1, 0, 432002, 67997]]], "class_labels": ["0", "1"], ' + \
        '"probability_thresholds": [0.52], "percentile_thresholds": [0.09]}}'

mlflow.log_dict(ACCURACY_TABLE, 'mlflow_accuracy_table.json')

Les métriques ne s’affichent pas en tant que table de précision dans Azure Machine Learning studio.
Journalisé en tant qu’artefact, et non en tant que métrique.
La méthode mlflow.log_dict est expérimentale.

Journaliser une matrice de confusion

SDK v1

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

azureml_run.log_confusion_matrix('v1_confusion_matrix', json.loads(CONF_MATRIX))

SDK v2 avec MLflow

CONF_MATRIX = '{"schema_type": "confusion_matrix", "schema_version": "v1", "data": {"class_labels": ' + \
    '["0", "1", "2", "3"], "matrix": [[3, 0, 1, 0], [0, 1, 0, 1], [0, 0, 1, 0], [0, 0, 0, 1]]}}'

mlflow.log_dict(CONF_MATRIX, 'mlflow_confusion_matrix.json')

Les métriques ne s’affichent pas en tant que matrice de fusion dans Azure Machine Learning studio.
Journalisé en tant qu’artefact, et non en tant que métrique.
La méthode mlflow.log_dict est expérimentale.

Journaliser des prédictions

SDK v1

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

azureml_run.log_predictions('test_predictions', json.loads(PREDICTIONS))

SDK v2 avec MLflow

PREDICTIONS = '{"schema_type": "predictions", "schema_version": "v1", "data": {"bin_averages": [0.25,' + \
    ' 0.75], "bin_errors": [0.013, 0.042], "bin_counts": [56, 34], "bin_edges": [0.0, 0.5, 1.0]}}'

mlflow.log_dict(PREDICTIONS, 'mlflow_predictions.json')

Les métriques ne s’affichent pas en tant que matrice de fusion dans Azure Machine Learning studio.
Journalisé en tant qu’artefact, et non en tant que métrique.
La méthode mlflow.log_dict est expérimentale.

Journaliser des résidus

SDK v1

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

azureml_run.log_residuals('test_residuals', json.loads(RESIDUALS))

SDK v2 avec MLflow

RESIDUALS = '{"schema_type": "residuals", "schema_version": "v1", "data": {"bin_edges": [100, 200, 300], ' + \
'"bin_counts": [0.88, 20, 30, 50.99]}}'

mlflow.log_dict(RESIDUALS, 'mlflow_residuals.json')

Les métriques ne s’affichent pas en tant que matrice de fusion dans Azure Machine Learning studio.
Journalisé en tant qu’artefact, et non en tant que métrique.
La méthode mlflow.log_dict est expérimentale.

Afficher les informations d’exécution et les données

Vous pouvez accéder aux informations d’exécution à l’aide des propriétés data et info de l’objet d’exécution MLflow (mlflow.entities.Run).

Conseil

Vous pouvez interroger les informations de suivi des expériences et des exécutions dans Azure Machine Learning à l’aide de MLflow, qui fournit une API de recherche complète pour interroger et rechercher facilement des expériences et des exécutions, et comparer rapidement les résultats. Pour plus d’informations sur toutes les fonctionnalités de MLflow dans cette dimension, consultez Requête & comparer les expériences et les exécutions avec MLflow

L’exemple suivant montre comment récupérer une exécution terminée :

from mlflow.tracking import MlflowClient

# Use MlFlow to retrieve the run that was just completed
client = MlflowClient()
finished_mlflow_run = MlflowClient().get_run("<RUN_ID>")

L’exemple suivant montre comment afficher metrics, tags et params :

metrics = finished_mlflow_run.data.metrics
tags = finished_mlflow_run.data.tags
params = finished_mlflow_run.data.params

Notes

metrics aura seulement la valeur journalisée la plus récente pour une métrique donnée. Par exemple, si vous journalisez dans l’ordre une valeur de 1, puis 2, 3 et enfin 4 en une métrique nommée sample_metric, seule 4 sera présente dans le dictionnaire metrics. Pour obtenir toutes les métriques enregistrées pour une métrique nommée spécifique, utilisez MlFlowClient.get_metric_history :

with mlflow.start_run() as multiple_metrics_run:
    mlflow.log_metric("sample_metric", 1)
    mlflow.log_metric("sample_metric", 2)
    mlflow.log_metric("sample_metric", 3)
    mlflow.log_metric("sample_metric", 4)

print(client.get_run(multiple_metrics_run.info.run_id).data.metrics)
print(client.get_metric_history(multiple_metrics_run.info.run_id, "sample_metric"))

Pour plus d’informations, consultez les informations de référence sur MlFlowClient.

Le champ info fournit des informations générales sur l’exécution, telles que l’heure de début, l’ID d’exécution, l’ID d’expérience, etc. :

run_start_time = finished_mlflow_run.info.start_time
run_experiment_id = finished_mlflow_run.info.experiment_id
run_id = finished_mlflow_run.info.run_id

Afficher les artefacts des exécutions

Pour afficher les artefacts d’une exécution, utilisez MlFlowClient.list_artifacts.

client.list_artifacts(finished_mlflow_run.info.run_id)

Pour télécharger un artefact, utilisez mlflow.artifacts.download_artifacts :

mlflow.artifacts.download_artifacts(run_id=finished_mlflow_run.info.run_id, artifact_path="Azure.png")

Partager via

Migrer la journalisation du SDK v1 vers SDK v2

Pourquoi MLflow ?

Préparer la migration vers MLflow

Se connecter à un espace de travail

Expériences et exécutions

Comparaison des API de journalisation

Journaliser une métrique de type entier ou float

Journaliser une métrique booléenne

Journaliser une métrique de chaîne

Journaliser une image dans un fichier PNG ou JPEG

Journaliser un matplotlib.pyplot

Journaliser une liste des métriques

Journaliser une ligne de métriques

Journaliser une table

Journaliser un table de précision

Journaliser une matrice de confusion

Journaliser des prédictions

Journaliser des résidus

Afficher les informations d’exécution et les données

Afficher les artefacts des exécutions

Étapes suivantes

Commentaires

Ressources supplémentaires