Bereitstellen von Modellen für die Bewertung in Batchendpunkten

Artikel
09/03/2024

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

Batchendpunkte bieten eine bequeme Möglichkeit, Modelle bereitzustellen, die Rückschlüsse über große Datenmengen ausführen. Diese Endpunkte vereinfachen das Hosten Ihrer Modelle für die Batchbewertung, sodass Sie sich auf das maschinelle Lernen und nicht auf die Infrastruktur konzentrieren können.

Verwenden Sie Batchendpunkte in folgenden Fällen für die Modellimplementierung:

Sie verfügen über aufwendige Modelle, bei denen die Ausführung des Rückschlusses mehr Zeit in Anspruch nimmt.
Sie müssen Rückschlüsse über große Datenmengen durchführen, die auf mehrere Dateien verteilt sind.
Sie haben keine niedrigen Latenzanforderungen.
Sie können die Parallelisierung nutzen.

In diesem Artikel verwenden Sie einen Batchendpunkt, um ein Machine Learning-Modell bereitzustellen, das das klassische MNIST-Ziffernerkennungsproblem (Modified National Institute of Standards and Technology) löst. Das bereitgestellte Modell führt dann Batchrückschlüsse über große Datenmengen aus – in diesem Fall Bilddateien. Zunächst erstellen Sie eine Batchbereitstellung eines Modells, das mit Torch erstellt wurde. Dies wird die Standardbereitstellung des Endpunkts. Später erstellen Sie eine zweite Bereitstellung eines Modells, das mit TensorFlow (Keras) erstellt wurde, testen diese zweite Bereitstellung und legen sie dann als Standardbereitstellung des Endpunkts fest.

Wenn Sie die Codebeispiele und Dateien nachvollziehen möchten, die zum lokalen Ausführen der Befehle in diesem Artikel erforderlich sind, lesen Sie den Abschnitt Klonen des Beispielrepositorys. Die Codebeispiele und Dateien sind im Repository azureml-examples enthalten.

Voraussetzungen

Stellen Sie vor dem Ausführen der Schritte in diesem Artikel sicher, dass Sie die folgenden Voraussetzungen erfüllt sind:

Ein Azure-Abonnement. Wenn Sie nicht über ein Azure-Abonnement verfügen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen. Probieren Sie die kostenlose oder kostenpflichtige Version von Azure Machine Learning aus.
Ein Azure Machine Learning-Arbeitsbereich. Wenn Sie keinen Arbeitsbereich haben, führen Sie die Schritte im Artikel Verwalten von Arbeitsbereichen aus, um einen Arbeitsbereich zu erstellen.
Um die folgenden Aufgaben auszuführen, müssen Sie im Arbeitsbereich über die folgenden Berechtigungen verfügen:
- Verwenden Sie zum Erstellen/Verwalten von Batchendpunkten und Bereitstellungen die Rolle „Besitzer“ oder „Mitwirkender“ bzw. eine benutzerdefinierte Rolle, die Microsoft.MachineLearningServices/workspaces/batchEndpoints/* zulässt.
- Verwenden Sie zum Erstellen von ARM-Bereitstellungen in der Ressourcengruppe des Arbeitsbereichs die Rolle „Besitzer“ oder „Mitwirkender“ bzw. eine benutzerdefinierte Rolle, die Microsoft.Resources/deployments/write in der Ressourcengruppe zulässt, in der der Arbeitsbereich bereitgestellt wird.
Für die Arbeit mit Azure Machine Learning müssen Sie die folgende Software installieren:
GILT FÜR Azure CLI-ML-Erweiterung v2 (aktuell)

Die Azure CLI und die ml-Erweiterung für Azure Machine Learning.
```
az extension add -n ml
```
GILT FÜR: Python SDK azure-ai-ml v2 (aktuell)

Installieren Sie das Azure Machine Learning SDK für Python.
```
pip install azure-ai-ml
```
Es gibt keine weiteren Anforderungen, wenn Sie Azure Machine Learning Studio verwenden möchten.

Klonen des Beispielrepositorys

Das Beispiel in diesem Artikel basiert auf Codebeispielen, die im Repository azureml-examples enthalten sind. Um die Befehle lokal auszuführen, ohne YAML und andere Dateien kopieren/einfügen zu müssen, klonen Sie zunächst das Repository, und ändern Sie dann die Verzeichnisse zum Ordner:

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli/endpoints/batch/deploy-models/mnist-classifier

!git clone https://github.com/Azure/azureml-examples --depth 1
!cd azureml-examples/sdk/python/endpoints/batch/deploy-models/mnist-classifier

Um dieses Beispiel in einem Jupyter Notebook nachzuverfolgen, öffnen Sie im geklonten Repository das Notebook mnist-batch.ipynb.

Vorbereiten Ihres Systems

Herstellen einer Verbindung mit Ihrem Arbeitsbereich

Stellen Sie zunächst eine Verbindung mit dem Azure Machine Learning-Arbeitsbereich her, in dem Sie arbeiten.

Wenn Sie die Standardeinstellungen für die Azure-Befehlszeilenschnittstelle noch nicht festgelegt haben, speichern Sie Ihre Standardeinstellungen. Um zu vermeiden, dass Sie die Werte für Ihr Abonnement, Ihren Arbeitsbereich, Ihre Ressourcengruppe und Ihren Standort mehrfach eingeben müssen, führen Sie den folgenden Code aus:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Der Arbeitsbereich ist die Ressource der obersten Ebene für Azure Machine Learning und ein zentraler Ort für die Arbeit mit allen Artefakten, die Sie während der Nutzung von Azure Machine Learning erstellen. In diesem Abschnitt stellen Sie eine Verbindung mit dem Arbeitsbereich her, in dem Sie die Bereitstellungsaufgaben ausführen werden.

Importieren Sie die erforderlichen Bibliotheken.

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Hinweis

Die Klassen ModelBatchDeployment und PipelineComponentBatchDeployment wurde in Version 1.7.0 des SDK eingeführt.

Konfigurieren von Arbeitsbereichsdetails und Abrufen eines Handles für den Arbeitsbereich:

subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Erstellen von Computeressourcen

Batchendpunkte werden in Computeclustern ausgeführt und unterstützen sowohl Azure Machine Learning-Computecluster (AmlCompute) als auch Kubernetes-Cluster. Cluster sind eine freigegebene Ressource, sodass ein Cluster eine oder mehrere Batchbereitstellungen hosten kann (zusammen mit anderen Workloads, falls gewünscht).

Erstellen Sie eine Computeressource mit dem Namen batch-cluster, wie im folgenden Code dargestellt. Sie können diese nach Bedarf anpassen und mit azureml:<your-compute-name> auf Ihre Computeressourcen verweisen.

az ml compute create -n batch-cluster --type amlcompute --min-instances 0 --max-instances 5

compute_name = "batch-cluster"
if not any(filter(lambda m: m.name == compute_name, ml_client.compute.list())):
    compute_cluster = AmlCompute(
        name=compute_name,
        description="CPU cluster compute",
        min_instances=0,
        max_instances=2,
    )
    ml_client.compute.begin_create_or_update(compute_cluster).result()

Hinweis

Zu diesem Zeitpunkt werden Ihnen noch keine Computeressourcen in Rechnung gestellt, da der Cluster bei 0 (null) Knoten verbleibt, bis ein Batchendpunkt aufgerufen und ein Batchbewertungsauftrag übermittelt wird. Weitere Informationen zu Computekosten finden Sie unter Verwalten und Optimieren der Kosten für AmlCompute.

Erstellen eines Batchendpunkts

Ein Batchendpunkt ist ein HTTPS-Endpunkt, den Clients aufrufen können, um einen Batchbewertungsauftrag auszulösen. Ein Batchbewertungsauftrag ist ein Auftrag, der mehrere Eingaben bewertet. Eine Batchbereitstellung umfasst die Computeressourcen, mit denen das Modell gehostet wird, das die eigentlichen Batchbewertungen (oder Batchrückschlüsse) durchführt. Ein Batchendpunkt kann über mehrere Batchbereitstellungen verfügen. Weitere Informationen zu Batchendpunkten finden Sie unter Was sind Batchendpunkte?.

Tipp

Eine der Batchbereitstellungen dient als Standardbereitstellung für den Endpunkt. Wenn der Endpunkt aufgerufen wird, führt die Standardbereitstellung die eigentliche Batchbewertung durch. Weitere Informationen zu Batchendpunkten und -bereitstellungen finden Sie unter Batchendpunkte und Batchbereitstellung.

Benennen Sie den Endpunkt. Der Name des Endpunkts muss innerhalb einer Azure-Region eindeutig sein, da der Name im URI des Endpunkts enthalten ist. Beispielsweise kann es nur einen Endpunkt namens mybatchendpoint in westus2 geben.
Speichern Sie den Namen des Endpunkts in einer Variable, damit Sie später ganz einfach darauf verweisen können.
```
ENDPOINT_NAME="mnist-batch"
```
Speichern Sie den Namen des Endpunkts in einer Variable, damit Sie später ganz einfach darauf verweisen können.
```
endpoint_name = "mnist-batch"
```
Sie geben den Namen des Endpunkts später ein, wenn Sie die Bereitstellung erstellen.

Konfigurieren des Batchendpunkts

Die folgende YAML-Datei definiert einen Batchendpunkt. Sie können diese Datei mit dem CLI-Befehl für die Erstellung von Batchendpunkten verwenden.

endpoint.yml

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: mnist-batch
description: A batch endpoint for scoring images from the MNIST dataset.
tags:
  type: deep-learning

In der folgenden Tabelle werden die wichtigsten Eigenschaften des Endpunkts beschrieben. Das vollständige YAML-Schema für den Batchendpunkt finden Sie unter CLI (v2) Batchendpunkt-YAML-Schema.

Schlüssel	BESCHREIBUNG
`name`	Der Name des Batchendpunkts. Muss auf Azure-Regionsebene eindeutig sein.
`description`	Die Beschreibung des Batchendpunkts. Diese Eigenschaft ist optional.
`tags`	Die Tags, die in den Endpunkt eingeschlossen werden sollen. Diese Eigenschaft ist optional.

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A batch endpoint for scoring images from the MNIST dataset.",
    tags={"type": "deep-learning"},
)

In der folgenden Tabelle werden die wichtigsten Eigenschaften des Endpunkts beschrieben. Weitere Informationen zur Definition von Batchendpunkten finden Sie unter der BatchEndpoint-Klasse.

Schlüssel	BESCHREIBUNG
`name`	Der Name des Batchendpunkts. Muss auf Azure-Regionsebene eindeutig sein.
`description`	Die Beschreibung des Batchendpunkts. Diese Eigenschaft ist optional.
`tags`	Die Tags, die in den Endpunkt eingeschlossen werden sollen. Diese Eigenschaft ist optional.

Erstellen des Endpunkts:
Führen Sie den folgenden Code aus, um einen Batchendpunkt zu erstellen.
```
az ml batch-endpoint create --file endpoint.yml  --name $ENDPOINT_NAME
```
```
ml_client.begin_create_or_update(endpoint).result()
```
Sie erstellen den Endpunkt zu einem späteren Zeitpunkt, wenn Sie die Bereitstellung erstellen.

Erstellen einer Batchbereitstellung

Eine Modellimplementierung ist ein Satz von Ressourcen, die für das Hosting des Modells erforderlich sind, das die eigentlichen Rückschlüsse ausführt. Um eine Batchmodellimplementierung zu erstellen, benötigen Sie die folgenden Elemente:

Ein im Arbeitsbereich registriertes Modell
Code zur Bewertung des Modells
Eine Umgebung, in der die Abhängigkeiten des Modells installiert sind
Vordefinierte Compute- und Ressourceneinstellungen

Beginnen Sie mit der Registrierung des Modells, das bereitgestellt werden soll, in diesem Fall ein Torch-Modell für das bekannte Problem der Ziffernerkennung (MNIST). Mit Batchbereitstellungen können nur Modelle bereitgestellt werden, die im Arbeitsbereich registriert sind. Sie können diesen Schritt überspringen, wenn das Modell, das Sie bereitstellen möchten, bereits registriert ist.

Tipp

Modelle sind der Bereitstellung und nicht dem Endpunkt zugeordnet. Dies bedeutet, dass an einem einzelnen Endpunkt mehrere Modelle (oder Modellversionen) bereitgestellt werden können, sofern die verschiedenen Modelle (oder Modellversionen) in verschiedenen Bereitstellungen bereitgestellt werden.
```
MODEL_NAME='mnist-classifier-torch'
az ml model create --name $MODEL_NAME --type "custom_model" --path "deployment-torch/model"
```
```
model_name = "mnist-classifier-torch"
model_local_path = "deployment-torch/model/"

model = ml_client.models.create_or_update(
    Model(
        name=model_name,
        path=model_local_path,
        type=AssetTypes.CUSTOM_MODEL,
        tags={"task": "classification", "framework": "torch"},
    )
)
```
1. Navigieren Sie im Seitenmenü zur Registerkarte Modelle.
2. Wählen Sie Registrieren>Aus lokalen Dateien aus.
3. Behalten Sie im Assistenten für die Option Modelltyp die Einstellung Nicht angegebener Typ bei.
4. Wählen Sie Durchsuchen>Ordner durchsuchen> aus. Wählen Sie den Ordner deployment-torch/model>Weiter aus.
5. Konfigurieren Sie den Namen des Modells: mnist-classifier-torch. Sie können die restlichen Felder unverändert lassen.
6. Wählen Sie Registrieren.

Nun ist es an der Zeit, ein Bewertungsskript zu erstellen. Batchbereitstellungen erfordern ein Bewertungsskript, das angibt, wie ein bestimmtes Modell ausgeführt werden soll und wie Eingabedaten verarbeitet werden müssen. Batchendpunkte unterstützen in Python erstellte Skripts. In diesem Fall wird ein Modell bereitgestellt, das Dateien mit Bilddarstellungen von Ziffern liest und die entsprechende Ziffer ausgibt. Das Bewertungsskript entspricht dem folgenden:

Hinweis

Bei MLflow-Modellen generiert Azure Machine Learning das Bewertungsskript automatisch, sodass Sie keines angeben müssen. Wenn es sich bei Ihrem Modell um ein MLflow-Modell handelt, können Sie diesen Schritt überspringen. Weitere Einzelheiten zur Funktionsweise von Batchendpunkten mit MLflow-Modellen finden Sie im Artikel Verwenden von MLflow-Modellen in Batchbereitstellungen.

Warnung

Wenn Sie ein AutoML-Modell (automatisiertes maschinelles Lernen) auf einem Batchendpunkt bereitstellen, beachten Sie, dass das von AutoML bereitgestellte Bewertungsskript nur für Onlineendpunkte funktioniert und nicht für die Batchausführung konzipiert ist. Weitere Informationen zum Erstellen eines Bewertungsskripts für Ihre Batchbereitstellung finden Sie unter Erstellen von Bewertungsskripts für Batchbereitstellungen.

deployment-torch/code/batch_driver.py

import os
import pandas as pd
import torch
import torchvision
import glob
from os.path import basename
from mnist_classifier import MnistClassifier
from typing import List


def init():
    global model
    global device

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    # It is the path to the model folder
    model_path = os.environ["AZUREML_MODEL_DIR"]
    model_file = glob.glob(f"{model_path}/*/*.pt")[-1]

    model = MnistClassifier()
    model.load_state_dict(torch.load(model_file))
    model.eval()

    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    with torch.no_grad():
        for image_path in mini_batch:
            image_data = torchvision.io.read_image(image_path).float()
            batch_data = image_data.expand(1, -1, -1, -1)
            input = batch_data.to(device)

            # perform inference
            predict_logits = model(input)

            # Compute probabilities, classes and labels
            predictions = torch.nn.Softmax(dim=-1)(predict_logits)
            predicted_prob, predicted_class = torch.max(predictions, axis=-1)

            results.append(
                {
                    "file": basename(image_path),
                    "class": predicted_class.numpy()[0],
                    "probability": predicted_prob.numpy()[0],
                }
            )

    return pd.DataFrame(results)

Erstellen Sie eine Umgebung, in der Ihre Batchbereitstellung ausgeführt wird. Diese Umgebung muss die Pakete azureml-core und azureml-dataset-runtime[fuse] enthalten, die für Batchendpunkte benötigt werden, sowie alle für die Ausführung Ihres Codes erforderlichen Abhängigkeiten. In diesem Fall wurden die Abhängigkeiten in der Datei conda.yaml erfasst:

deployment-torch/environment/conda.yaml
```
name: mnist-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip<22.0
  - pip:
    - torch==1.13.0
    - torchvision==0.14.0
    - pytorch-lightning
    - pandas
    - azureml-core
    - azureml-dataset-runtime[fuse]
```
Wichtig

Die Pakete azureml-core und azureml-dataset-runtime[fuse] sind für Batchbereitstellungen erforderlich und sollten in die Umgebungsabhängigkeiten aufgenommen werden.

Geben Sie die Umgebung wie folgt an:
Die Umgebungsdefinition wird als anonyme Umgebung in die Bereitstellungsdefinition selbst aufgenommen. Sie sehen die folgenden Zeilen in der Bereitstellung:
```
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
Rufen Sie einen Verweis auf die Umgebung ab:
```
env = Environment(
    name="batch-torch-py38",
    conda_file="deployment-torch/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
Führen Sie in Azure Machine Learning Studio die folgenden Schritte aus:
1. Navigieren Sie im Seitenmenü zur Registerkarte Umgebungen.
2. Wählen Sie die Registerkarte Benutzerdefinierte Umgebungen>Erstellen aus.
3. Geben Sie den Namen der Umgebung ein, in diesem Fall torch-batch-env.
4. Wählen Sie für Umgebungsquelle auswählen die Option Vorhandenes Docker-Image mit optionaler Conda-Datei verwenden aus.
5. Geben Sie für Imagepfad für Containerregistrierung Folgendes ein: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04.
6. Wählen Sie Weiter aus, um zum Abschnitt „Anpassen“ zu gelangen.
7. Kopieren Sie den Inhalt der Datei deployment-torch/environment/conda.yaml aus dem GitHub-Repository in das Portal.
8. Wählen Sie Weiter aus, bis Sie zur Seite „Überprüfen“ gelangen.
9. Wählen Sie Erstellen aus, und warten Sie, bis die Umgebung einsatzbereit ist.
Warnung

Zusammengestellte Umgebungen werden in Batchbereitstellungen nicht unterstützt. Sie müssen Ihre eigene Umgebung angeben. Sie können jederzeit das Basisimage einer zusammengestellten Umgebung als Ihres verwenden, um den Prozess zu vereinfachen.

Neue Bereitstellungsdefinition erstellen

deployment-torch/deployment.yml

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-torch-dpl
description: A deployment using Torch to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model:
  name: mnist-classifier-torch
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 30
  error_threshold: -1
  logging_level: info

In der folgenden Tabelle werden die wichtigsten Eigenschaften der Batchbereitstellung beschrieben. Das vollständige YAML-Schema für die Batchbereitstellung finden Sie unter CLI (v2) Batchbereitstellungs-YAML-Schema.

Schlüssel	BESCHREIBUNG
`name`	Der Name der Bereitstellung
`endpoint_name`	Der Name des Endpunkts, unter dem die Bereitstellung erstellt werden soll.
`model`	Das Modell, das für die Batchbewertung verwendet werden soll. Im Beispiel wird ein Inline-Modell mit `path` definiert. Mit dieser Definition können Modelldateien automatisch hochgeladen und mit automatisch generierten Werten für Name und Version registriert werden. Im Modellschema finden Sie weitere Optionen. Als bewährtes Verfahren für Produktionsszenarien sollten Sie das Modell separat erstellen und hier darauf verweisen. Um auf ein bestehendes Modell zu verweisen, verwenden Sie die Syntax `azureml:<model-name>:<model-version>`.
`code_configuration.code`	Das lokale Verzeichnis, das den gesamten Python-Quellcode für die Bewertung des Modells enthält.
`code_configuration.scoring_script`	Die Python-Datei im Verzeichnis `code_configuration.code`. Diese Datei muss über eine Funktion vom Typ `init()` und über eine Funktion vom Typ `run()` verfügen. Verwenden Sie die `init()`-Funktion für die aufwendige oder häufig angewandte Vorbereitungsschritte (z. B. wenn Sie das Modell in den Arbeitsspeicher laden). `init()` wird nur einmal zu Beginn des Prozesses aufgerufen. Verwenden Sie `run(mini_batch)`, um die einzelnen Einträge zu bewerten. Der Wert von `mini_batch` ist eine Liste mit Dateipfaden. Die Funktion `run()` sollte einen Pandas-Datenrahmen oder ein Array zurückgeben. Jedes zurückgegebene Element deutet auf eine erfolgreiche Ausführung eines Eingabeelements im `mini_batch` hin. Weitere Informationen zum Erstellen eines Bewertungsskripts finden Sie unter Grundlegendes zum Bewertungsskript.
`environment`	Die Umgebung zum Bewerten des Modells. Im Beispiel wird eine Inline-Umgebung mit `conda_file` und `image` definiert. Die `conda_file`-Abhängigkeiten werden zusätzlich zum `image` installiert. Die Umgebung wird automatisch mit einem automatisch generierten Namen und einer automatisch generierten Version registriert. Im Umgebungsschema finden Sie weitere Optionen. Als bewährtes Verfahren für Produktionsszenarien sollten Sie die Umgebung separat erstellen und hier referenzieren. Verwenden Sie die Syntax `azureml:<environment-name>:<environment-version>`, um auf eine vorhandene Umgebung zu verweisen.
`compute`	Die Computeressource zum Ausführen der Batchbewertung. Im Beispiel wird der am Anfang erstellte `batch-cluster` verwendet, auf den mithilfe der Syntax `azureml:<compute-name>` verwiesen wird.
`resources.instance_count`	Die Anzahl der Instanzen, die für jeden Batchbewertungsauftrag verwendet werden sollen.
`settings.max_concurrency_per_instance`	Die maximale Anzahl von parallelen `scoring_script` Läufen pro Instanz.
`settings.mini_batch_size`	Die Anzahl der Dateien, die `scoring_script` in einem `run()`-Aufruf verarbeiten kann.
`settings.output_action`	Gibt an, wie die Ausgabe in der Ausgabedatei organisiert werden soll `append_row` führt alle von `run()` zurückgegebenen Ausgabeergebnisse in einer einzelnen Datei mit dem Namen `output_file_name` zusammen. `summary_only` führt die Ausgabeergebnisse nicht zusammen, sondern berechnet nur `error_threshold`.
`settings.output_file_name`	Der Name der Ausgabedatei der Batchbewertung für `append_rowoutput_action`.
`settings.retry_settings.max_retries`	Die maximale Anzahl von Versuchen bei einer nicht erfolgreichen `scoring_script` `run()`.
`settings.retry_settings.timeout`	Die Zeitüberschreitung in Sekunden für ein `scoring_script` `run()` für das Erfassen eines Mini-Batches.
`settings.error_threshold`	Die Anzahl von Eingabedatei-Bewertungsfehlern, die ignoriert werden sollen. Wenn die Fehlerzahl für die gesamte Eingabe diesen Wert übersteigt, wird der Batchbewertungsauftrag abgebrochen. Im Beispiel wird `-1` verwendet. Dadurch wird angegeben, dass eine beliebige Anzahl von Fehlern zulässig ist, ohne den Batchbewertungsauftrag abzubrechen.
`settings.logging_level`	Die Ausführlichkeit des Protokolls. Mögliche Werte nach zunehmender Ausführlichkeit sind „WARNING“ (Warnung), „INFO“ (Information) und „DEBUG“ (Debuggen).
`settings.environment_variables`	Wörterbuch mit Namen-Wert-Paaren von Umgebungsvariablen, die für jeden Batch-Scoring-Auftrag festzulegen sind.

deployment = ModelBatchDeployment(
    name="mnist-torch-dpl",
    description="A deployment using Torch to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-torch/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        instance_count=2,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)

Mit der BatchDeployment-Klasse können Sie die folgenden wichtigen Eigenschaften einer Batchbereitstellung konfigurieren:

Schlüssel	BESCHREIBUNG
`name`	Name der Bereitstellung
`endpoint_name`	Name des Endpunkts, unter dem die Bereitstellung erstellt werden soll.
`model`	Das für die Bereitstellung zu verwendende Modell. Dieser Wert kann entweder ein Verweis auf ein vorhandenes versioniertes Modell im Arbeitsbereich oder eine Inline-Modellspezifikation sein.
`environment`	Die für die Bereitstellung zu verwendende Umgebung. Dieser Wert kann entweder ein Verweis auf eine vorhandene versionierte Umgebung im Arbeitsbereich oder eine Inline-Umgebungsspezifikation sein (optional für MLflow-Modelle).
`code_configuration`	Die Konfiguration zum Ausführen der Rückschlüsse für das Modell (optional für MLflow-Modelle).
`code_configuration.code`	Der Pfad zum Quellcodeverzeichnis für die Bewertung des Modells
`code_configuration.scoring_script`	Relativer Pfad zur Bewertungsdatei im Quellcodeverzeichnis.
`compute`	Der Name des Computeziel, auf dem die Batchbewertungsaufträge ausgeführt werden sollen
`instance_count`	Die Anzahl der Knoten, die für jeden Batch-Scoring-Auftrag verwendet werden sollen.
`settings`	Die Rückschlusskonfiguration der Modellimplementierung
`settings.max_concurrency_per_instance`	Die maximale Anzahl von parallelen `scoring_script` Läufen pro Instanz.
`settings.mini_batch_size`	Die Anzahl der Dateien, die `code_configuration.scoring_script` in einem Aufruf von `run`() verarbeiten kann.
`settings.retry_settings`	Wiederholungseinstellungen für die Bewertung jeder Mini-Charge.
`settings.retry_settingsmax_retries`	Die maximale Anzahl von Wiederholungsversuchen für einen Minibatch, bei dem ein Fehler oder Timeout aufgetreten ist (Standardwert ist 3)
`settings.retry_settingstimeout`	Das Zeitlimit in Sekunden für die Bewertung eines Minibatches (Standardwert ist 30)
`settings.output_action`	Gibt an, wie die Ausgabe in der Ausgabedatei organisiert werden soll Zulässige Werte: `append_row` und `summary_only`. Der Standardwert ist `append_row`.
`settings.logging_level`	Die Ausführlichkeitsstufe des Protokolls. Zulässige Werte sind: `warning`, `info`, `debug`. Der Standardwert ist `info`.
`settings.environment_variables`	Wörterbuch mit Namen-Wert-Paaren von Umgebungsvariablen, die für jeden Batch-Scoring-Auftrag festzulegen sind.

Führen Sie in Studio die folgenden Schritte aus:

Navigieren Sie im Seitenmenü zur Registerkarte Endpunkte.
Wählen Sie die Registerkarte Batchendpunkte>Erstellen aus.
Geben Sie dem Endpunkt einen Namen, in diesem Fall mnist-batch. Sie können die restlichen Felder konfigurieren oder leer lassen.
Wählen Sie Weiter aus, um zum Abschnitt „Modell“ zu wechseln.
Wählen Sie das Modell mnist-classifier-torch aus.
Wählen Sie Weiter aus, um zur Seite „Bereitstellung“ zu wechseln.
Geben Sie der Bereitstellung einen Namen.
Stellen Sie unter Ausgabeaktion sicher, dass Zeile anfügen ausgewählt ist.
Stellen Sie unter Ausgabedateiname sicher, dass die Ausgabedatei für die Batchbewertung die von Ihnen benötigte Datei ist. Der Standardwert ist predictions.csv.
Passen Sie unter Minibatchgröße die Größe der Dateien an, die in den einzelnen Minibatches enthalten sein werden. Dadurch wird die Datenmenge gesteuert, die Ihr Bewertungsskript pro Batch empfängt.
Weisen Sie Ihrer Bereitstellung unter Zeitlimit für Bewertung (Sekunden) ausreichend Zeit zu, einen bestimmten Batch von Dateien zu bewerten. Wenn Sie die Anzahl Dateien erhöhen, müssen Sie in der Regel auch den Timeoutwert erhöhen. Teurere Modelle (z. B. solche, die auf Deep Learning basieren) erfordern möglicherweise hohe Werte in diesem Feld.
Konfigurieren Sie unter Max. Parallelität pro Instanz die Anzahl Executors, die pro Compute-Instanz in der Bereitstellung verwendet werden sollen. Eine höhere Anzahl garantiert hier einen höheren Grad an Parallelisierung, erhöht aber auch den Arbeitsspeicherdruck auf der Computeinstanz. Optimieren Sie diesen Wert zusammen mit der Minibatchgröße.
Wählen Sie Weiter aus, um zur Seite „Code und Umgebung“ zu wechseln.
Suchen Sie unter „Bewertungsskript für Rückschluss auswählen“ nach der Bewertungsskriptdatei deployment-torch/code/batch_driver.py, und wählen Sie sie aus.
Wählen Sie im Abschnitt „Umgebung auswählen“ die Umgebung torch-batch-env aus, die Sie zuvor erstellt haben.
Wählen Sie Weiter aus, um zur Seite „Compute“ zu gelangen.
Wählen Sie den Computecluster aus, den Sie in einem vorherigen Schritt erstellt haben.

Warnung

Azure Kubernetes-Cluster werden in Batchbereitstellungen unterstützt, aber nur, wenn sie mit der Azure Machine Learning CLI oder dem Python SDK erstellt werden.
Geben Sie unter Instanzanzahl die gewünschte Anzahl Compute-Instanzen für die Bereitstellung ein. Verwenden Sie in diesem Fall 2.
Wählen Sie Weiter aus.

Erstellen Sie die Bereitstellung:
Führen Sie den folgenden Code aus, um eine Batchbereitstellung unter dem Batchendpunkt zu erstellen und diese als Standardbereitstellung festzulegen.
```
az ml batch-deployment create --file deployment-torch/deployment.yml --endpoint-name $ENDPOINT_NAME --set-default
```
Tipp

Der --set-default-Parameter legt die neu erstellte Bereitstellung als Standardbereitstellung des Endpunkts fest. Insbesondere beim erstmaligen Erstellen einer Bereitstellung ist dies eine praktische Möglichkeit, um eine neue Standardbereitstellung des Endpunkts zu erstellen. Als bewährte Methode für Produktionsszenarien wird empfohlen, eine neue Bereitstellung zu erstellen, ohne sie als Standard festzulegen. Überprüfen Sie, ob die Bereitstellung wie erwartet funktioniert, und aktualisieren Sie die Standardbereitstellung später. Weitere Informationen zur Implementierung dieses Prozesses finden Sie im Abschnitt Bereitstellen eines neuen Modells.
Erstellen Sie mithilfe des zuvor erstellten MLClient die Bereitstellung im Arbeitsbereich. Dieser Befehl startet die Bereitstellungserstellung und gibt eine Bestätigungsantwort zurück, während die Bereitstellungserstellung fortgesetzt wird.
```
ml_client.begin_create_or_update(deployment).result()
```
Legen Sie nach Abschluss der Bereitstellung die neue Bereitstellung als Standardbereitstellung auf dem Endpunkt fest:
```
endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
Wählen Sie im Assistenten Erstellen aus, um den Bereitstellungsprozess zu starten.
Überprüfen Sie die Batchendpunkt- und Bereitstellungsdetails.
Verwenden Sie show, um die Details zu Endpunkt und Bereitstellung zu überprüfen. Führen Sie den folgenden Code aus, um eine Batchbereitstellung zu überprüfen:
```
DEPLOYMENT_NAME="mnist-torch-dpl"
az ml batch-deployment show --name $DEPLOYMENT_NAME --endpoint-name $ENDPOINT_NAME
```
Führen Sie den folgenden Code aus, um eine Batchbereitstellung zu überprüfen:
```
ml_client.batch_deployments.get(name=deployment.name, endpoint_name=endpoint.name)
```
Nach dem Erstellen des Batchendpunkts wird die Detailseite des Endpunkts geöffnet. Sie können diese Seite auch wie folgt anzeigen:
1. Navigieren Sie im Seitenmenü zur Registerkarte Endpunkte.
2. Wählen Sie die Registerkarte Batchendpunkte aus.
3. Wählen Sie den anzuzeigenden Batchendpunkt aus.
4. Auf der Seite Details des Endpunkts werden die Details zum Endpunkt zusammen mit allen auf dem Endpunkt verfügbaren Bereitstellungen angezeigt.

Ausführen von Batch-Endpunkten und Zugreifen auf Ergebnisse

Das Aufrufen eines Batchendpunkts löst einen Batchbewertungsauftrag aus. Von der Aufrufantwort wird der Auftrag name zurückgegeben, mit dem Sie den Fortschritt der Batchbewertung nachverfolgen können. Wenn Sie Modelle für die Bewertung auf Batchendpunkten ausführen, müssen Sie den Pfad zu den Eingabedaten angeben, damit die Endpunkte die Daten finden können, die Sie bewerten möchten. Das folgende Beispiel zeigt, wie Sie einen neuen Auftrag über eine Stichprobe von Daten der MNIST-Datenbank starten, die in einem Azure Storage-Konto gespeichert ist.

Sie können einen Batchendpunkt mit der Azure CLI, dem Azure Machine Learning-SDK oder REST-Endpunkten ausführen und aufrufen. Weitere Informationen zu diesen Optionen finden Sie unter Erstellen von Aufträgen und Eingabedaten für Batchendpunkte.

Hinweis

Wie funktioniert die Parallelisierung?

Batchbereitstellungen verteilen die Arbeit auf Dateiebene. Demnach generiert ein Ordner mit 100 Dateien mit Minibatches von 10 Dateien 10 Batches mit jeweils 10 Dateien. Beachten Sie, dass dies unabhängig von der Größe der involvierten Dateien erfolgt. Wenn Ihre Dateien zu groß sind, um in großen Minibatches verarbeitet zu werden, wird empfohlen, die Dateien entweder in kleinere Dateien aufzuteilen, um ein höheres Maß an Parallelität zu erzielen, oder die Anzahl Dateien pro Minibatch zu verringern. Derzeit können Batchbereitstellungen keine Scherung in der Größenverteilung einer Datei berücksichtigen.

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

Tipp

Was ist der Unterschied zwischen dem inputs- und dem input-Parameter, wenn Sie einen Endpunkt aufrufen?

Im Allgemeinen können Sie einen inputs = {}-Parameter im Wörterbuch mit der invoke-Methode verwenden, um eine beliebige Anzahl erforderlicher Eingaben für einen Batchendpunkt bereitzustellen, der eine Modellimplementierung oder eine Pipelinebereitstellung enthält.

Bei einer Modellimplementierung können Sie den input-Parameter als schnellere Möglichkeit verwenden, um den Eingabedatenspeicherort für die Bereitstellung anzugeben. Dieser Ansatz funktioniert, weil eine Modellimplementierung immer nur eine Dateneingabe entgegennimmt.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

Navigieren Sie im Seitenmenü zur Registerkarte Endpunkte.
Wählen Sie die Registerkarte Batchendpunkte aus.
Wählen Sie den Endpunkt aus, den Sie gerade erstellt haben.
Klicken Sie auf Auftrag erstellen.
Wählen Sie unter Bereitstellung die auszuführende Bereitstellung aus.
Wählen Sie Weiter aus, um zur Seite „Datenquelle auswählen“ zu wechseln.
Wählen Sie unter „Datenquellentyp“ die Option Datenspeicher aus.
Wählen Sie als „Datenspeicher“ im Dropdownmenü die Option workspaceblobstore aus.
Geben Sie unter „Pfad“ die vollständige URL https://azuremlexampledata.blob.core.windows.net/data/mnist/sample ein.

Tipp

Dieser Pfad funktioniert nur, da für den angegebenen Pfad öffentlicher Zugriff aktiviert ist. Ganz allgemein müssen Sie die Datenquelle als Datenspeicher registrieren. Einzelheiten dazu finden Sie unter Zugreifen auf Daten von Batchendpunktaufträgen.
Wählen Sie Weiter aus.
Wählen Sie Erstellen aus, um den Auftrag zu starten.

Batchendpunkte unterstützen das Lesen von Dateien oder Ordnern, die sich an unterschiedlichen Standorten befinden. Weitere Informationen zu den unterstützten Typen und deren Angabe finden Sie unter Zugreifen auf Daten aus Batchendpunktaufträgen.

Überwachen des Ausführungsfortschritts des Batch-Auftrags

Bei Batchbewertungsaufträgen dauert es in der Regel etwas, bis sämtliche Eingaben verarbeitet wurden.

Der folgende Code überprüft den Auftragsstatus und gibt einen Link zu Azure Machine Learning Studio für weitere Details aus.

az ml job show -n $JOB_NAME --web

Der folgende Code überprüft den Auftragsstatus und gibt einen Link zu Azure Machine Learning Studio für weitere Details aus.

ml_client.jobs.get(job.name)

Überprüfen der Ergebnisse der Batchbewertung

Die Ausgaben des Auftrags werden im Cloudspeicher gespeichert, und zwar entweder im Standardblobspeicher des Arbeitsbereichs oder in dem von Ihnen angegebenen Speicher. Weitere Informationen zum Ändern der Standardwerte finden Sie unter Konfigurieren des Ausgabespeicherorts. Befolgen Sie nach Abschluss des Auftrags die nachstehenden Schritte, um die Bewertungsergebnisse in Azure Storage-Explorer anzuzeigen:

Führen Sie den folgenden Code aus, um den Batchbewertungsauftrag in Azure Machine Learning Studio zu öffnen. Der Studio-Link des Auftrags ist ebenfalls in der Antwort von invoke als Wert von interactionEndpoints.Studio.endpoint enthalten.
```
az ml job show -n $JOB_NAME --web
```
Wählen Sie im Auftragsgraph den Schritt batchscoring aus.
Wählen Sie die Registerkarte Ausgaben und Protokolle und dann Datenausgaben anzeigen aus.
Wählen Sie unter Datenausgabendas entsprechende Symbol aus, um Storage-Explorer zu öffnen.

Die Bewertungsergebnisse in Storage-Explorer ähneln der folgenden Beispielseite:

Konfigurieren des Ausgabespeicherorts

Die Ergebnisse der Batchbewertung werden standardmäßig im Standardblobspeicher des Arbeitsbereichs in einem nach dem Auftrag benannten Ordner gespeichert. Bei dem Auftragsnamen handelt es sich um eine systemseitig generierte GUID. Beim Aufrufen eines Batchendpunkts können Sie konfigurieren, wo die Bewertungsausgaben gespeichert werden sollen.

Verwenden Sie output-path, um einen beliebigen Ordner in einem registrierten Azure Machine Learning-Datenspeicher zu konfigurieren. Die Syntax für --output-path ist dieselbe wie für --input, wenn Sie einen Ordner angeben, also azureml://datastores/<datastore-name>/paths/<path-on-datastore>/. Verwenden Sie --set output_file_name=<your-file-name>, um einen neuen Ausgabedateinamen zu konfigurieren.

OUTPUT_FILE_NAME=predictions_`echo $RANDOM`.csv
OUTPUT_PATH="azureml://datastores/workspaceblobstore/paths/$ENDPOINT_NAME"

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --output-path $OUTPUT_PATH --set output_file_name=$OUTPUT_FILE_NAME --query name -o tsv)

Verwenden Sie params_override, um einen beliebigen Ordner in einem registrierten Azure Machine Learning-Datenspeicher zu konfigurieren. Nur registrierte Datenspeicher werden als Ausgabepfade unterstützt. In diesem Beispiel verwenden Sie den Standarddatenspeicher:

batch_ds = ml_client.datastores.get_default()

Nachdem Sie den gewünschten Datenspeicher identifiziert haben, konfigurieren Sie die Ausgabe wie folgt:

filename = f"predictions-{random.randint(0,99999)}.csv"

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
    params_override=[
        {"output_dataset.datastore_id": f"azureml:{batch_ds.id}"},
        {"output_dataset.path": f"/{endpoint_name}/"},
        {"output_file_name": filename},
    ],
)

Warnung

Der Ausgabespeicherort muss eindeutig sein. Ist die Ausgabedatei bereits vorhanden, tritt für den Batchbewertungsauftrag ein Fehler auf.

Wichtig

Im Gegensatz zu Eingaben können Ausgaben nur in Azure Machine Learning-Datenspeichern gespeichert werden, die unter Blob Storage-Konten ausgeführt werden.

Außerkraftsetzen der Bereitstellungskonfiguration pro Auftrag

Wenn Sie einen Batchendpunkt aufrufen, können Sie einige Einstellungen außer Kraft setzen, um die Computeressourcen optimal zu nutzen und die Leistung zu verbessern. Die folgenden Einstellungen können auftragsbezogen konfiguriert werden:

Instanzanzahl: Verwenden Sie diese Einstellung, um die Anzahl Instanzen zu überschreiben, die vom Computecluster anzufordern sind. Für eine größere Menge von Dateneingaben empfiehlt es sich beispielsweise, mehr Instanzen zu verwenden, um die End-to-End-Batchbewertung zu beschleunigen.
Minibatchgröße: Verwenden Sie diese Einstellung, um die Anzahl Dateien zu überschreiben, die in jeden Minibatch eingeschlossen werden sollen. Die Anzahl der Minibatches wird durch die Gesamtanzahl der Eingabedateien und durch die Größe des Minibatches bestimmt. Bei einer kleineren Minibatchgröße werden mehr Minibatches generiert. Minibatches können zwar parallel ausgeführt werden, aber es kann zu zusätzlichem Zeitplanungs- und Aufrufaufwand kommen.
Andere Einstellungen wie Max. Wiederholungen, Timeout und Fehlerschwellenwert können außer Kraft gesetzt werden. Diese Einstellungen können sich auf die End-to-End-Batchbewertungszeit für verschiedene Workloads auswirken.

JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --mini-batch-size 20 --instance-count 5 --query name -o tsv)

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/"
    ),
    params_override=[{"mini_batch_size": "20"}, {"compute.instance_count": "5"}],
)

Hinzufügen von Bereitstellungen zu einem Endpunkt

Sobald Sie über einen Batchendpunkt mit einer Bereitstellung verfügen, können Sie Ihr Modell weiter optimieren und neue Bereitstellungen hinzufügen. Batchendpunkte stellen weiterhin die Standardbereitstellung bereit, während Sie neue Modelle unter demselben Endpunkt entwickeln und bereitstellen. Bereitstellungen wirken sich nicht aufeinander aus.

In diesem Beispiel fügen Sie eine zweite Bereitstellung hinzu, die ein mit Keras und TensorFlow erstelltes Modell verwendet, um dasselbe MNIST-Problem zu lösen.

Hinzufügen einer zweiten Bereitstellung

Erstellen Sie eine Umgebung, in der Ihre Batchbereitstellung ausgeführt wird. Fügen Sie in die Umgebung alle Abhängigkeiten ein, die Ihr Code für die Ausführung benötigt. Sie müssen auch die Bibliothek azureml-core hinzufügen, da sie erforderlich ist, damit Batchbereitstellungen funktionieren. Die folgende Umgebungsdefinition enthält die erforderlichen Bibliotheken, um ein Modell mit TensorFlow auszuführen.
Die Umgebungsdefinition wird als anonyme Umgebung in die Bereitstellungsdefinition selbst aufgenommen.
```
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
```
Rufen Sie einen Verweis auf die Umgebung ab:
```
env = Environment(
    name="batch-tensorflow-py38",
    conda_file="deployment-keras/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest",
)
```
1. Navigieren Sie im Seitenmenü zur Registerkarte Umgebungen.
2. Wählen Sie die Registerkarte Benutzerdefinierte Umgebungen>Erstellen aus.
3. Geben Sie den Namen der Umgebung ein, in diesem Fall keras-batch-env.
4. Wählen Sie für Umgebungsquelle auswählen die Option Vorhandenes Docker-Image mit optionaler Conda-Datei verwenden aus.
5. Geben Sie für Imagepfad für Containerregistrierung Folgendes ein: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04.
6. Wählen Sie Weiter aus, um zum Abschnitt „Anpassen“ zu gelangen.
7. Kopieren Sie den Inhalt der Datei deployment-keras/environment/conda.yaml aus dem GitHub-Repository in das Portal.
8. Wählen Sie Weiter aus, bis Sie zur Seite „Überprüfen“ gelangen.
9. Wählen Sie Erstellen aus, und warten Sie, bis die Umgebung einsatzbereit ist.
Die verwendete Conda-Datei sieht wie folgt aus:

deployment-keras/environment/conda.yaml
```
name: tensorflow-env
channels:
  - conda-forge
dependencies:
  - python=3.8.5
  - pip
  - pip:
    - pandas
    - tensorflow
    - pillow
    - azureml-core
    - azureml-dataset-runtime[fuse]
```

Erstellen eines Bewertungsskripts für das Modell:

deployment-keras/code/batch_driver.py

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from typing import List
from os.path import basename
from PIL import Image
from tensorflow.keras.models import load_model


def init():
    global model

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)


def run(mini_batch: List[str]) -> pd.DataFrame:
    print(f"Executing run method over batch of {len(mini_batch)} files.")

    results = []
    for image_path in mini_batch:
        data = Image.open(image_path)
        data = np.array(data)
        data_batch = tf.expand_dims(data, axis=0)

        # perform inference
        pred = model.predict(data_batch)

        # Compute probabilities, classes and labels
        pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
        pred_class = tf.math.argmax(pred, axis=-1).numpy()

        results.append(
            {
                "file": basename(image_path),
                "class": pred_class[0],
                "probability": pred_prob,
            }
        )

    return pd.DataFrame(results)

Neue Bereitstellungsdefinition erstellen
deployment-keras/deployment.yml
```
$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-keras-dpl
description: A deployment using Keras with TensorFlow to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model: 
  name: mnist-classifier-keras
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-tensorflow-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
```
```
deployment_keras = ModelBatchDeployment(
    name="mnist-keras-dpl",
    description="A deployment using Keras to solve the MNIST classification dataset.",
    endpoint_name=endpoint_name,
    model=model,
    code_configuration=CodeConfiguration(
        code="deployment-keras/code/", scoring_script="batch_driver.py"
    ),
    environment=env,
    compute=compute_name,
    settings=ModelBatchDeploymentSettings(
        instance_count=2,
        max_concurrency_per_instance=2,
        mini_batch_size=10,
        output_action=BatchDeploymentOutputAction.APPEND_ROW,
        output_file_name="predictions.csv",
        retry_settings=BatchRetrySettings(max_retries=3, timeout=30),
        logging_level="info",
    ),
)
```
1. Navigieren Sie im Seitenmenü zur Registerkarte Endpunkte.
2. Wählen Sie die Registerkarte Batchendpunkte aus.
3. Wählen Sie den vorhandenen Batchendpunkt aus, dem Sie die Bereitstellung hinzufügen möchten.
4. Wählen Sie Bereitstellung hinzufügen aus.
5. Wählen Sie Weiter aus, um zur Seite „Modell“ zu wechseln.
6. Wählen Sie in der Modellliste das Modell mnist und dann Weiter aus.
7. Geben Sie auf der Seite für die Bereitstellungskonfiguration einen Namen für die Bereitstellung ein.
8. Deaktivieren Sie die Option Diese neue Bereitstellung als Standard für Batchaufträge festlegen.
9. Stellen Sie unter Ausgabeaktion sicher, dass Zeile anfügen ausgewählt ist.
10. Stellen Sie unter Ausgabedateiname sicher, dass die Ausgabedatei für die Batchbewertung die von Ihnen benötigte Datei ist. Der Standardwert ist predictions.csv.
11. Passen Sie unter Minibatchgröße die Größe der Dateien an, die in den einzelnen Minibatches enthalten sein werden. Dadurch wird die Datenmenge gesteuert, die Ihr Bewertungsskript pro Batch empfängt.
12. Weisen Sie Ihrer Bereitstellung unter Zeitlimit für Bewertung (Sekunden) ausreichend Zeit zu, einen bestimmten Batch von Dateien zu bewerten. Wenn Sie die Anzahl Dateien erhöhen, müssen Sie in der Regel auch den Timeoutwert erhöhen. Teurere Modelle (z. B. solche, die auf Deep Learning basieren) erfordern möglicherweise hohe Werte in diesem Feld.
13. Konfigurieren Sie unter Max. Parallelität pro Instanz die Anzahl Executors, die pro Compute-Instanz in der Bereitstellung verwendet werden sollen. Eine höhere Anzahl garantiert hier einen höheren Grad an Parallelisierung, erhöht aber auch den Arbeitsspeicherdruck auf der Computeinstanz. Optimieren Sie diesen Wert zusammen mit der Minibatchgröße.
14. Wählen Sie Weiter aus, um zur Seite „Code und Umgebung“ zu wechseln.
15. Suchen Sie unter Bewertungsskript für Rückschluss auswählen nach der Bewertungsskriptdatei deployment-keras/code/batch_driver.py, und wählen Sie sie aus.
16. Wählen Sie unter Umgebung auswählen die Umgebung aus, die Sie im vorherigen Schritt erstellt haben.
17. Wählen Sie Weiter aus.
18. Wählen Sie auf der Seite Compute den Computecluster aus, den Sie im vorherigen Schritt erstellt haben.
19. Geben Sie unter Instanzanzahl die gewünschte Anzahl Compute-Instanzen für die Bereitstellung ein. Verwenden Sie in diesem Fall 2.
20. Wählen Sie Weiter aus.
Erstellen Sie die Bereitstellung:
Führen Sie den folgenden Code aus, um eine Batchbereitstellung unter dem Batchendpunkt zu erstellen und diese als Standardbereitstellung festzulegen.
```
az ml batch-deployment create --file deployment-keras/deployment.yml --endpoint-name $ENDPOINT_NAME
```
Tipp

Der --set-default-Parameter fehlt in diesem Fall. Als bewährte Methode für Produktionsszenarien wird empfohlen, eine neue Bereitstellung zu erstellen, ohne sie als Standard festzulegen. Überprüfen Sie sie zunächst, und aktualisieren Sie die Standardbereitstellung später.
Erstellen Sie mithilfe des zuvor erstellten MLClient die Bereitstellung im Arbeitsbereich. Dieser Befehl startet die Bereitstellungserstellung und gibt eine Bestätigungsantwort zurück, während die Bereitstellungserstellung fortgesetzt wird.
```
ml_client.begin_create_or_update(deployment_keras).result()
```
Wählen Sie im Assistenten Erstellen aus, um den Bereitstellungsprozess zu starten.

Testen einer nicht standardmäßigen Batchbereitstellung

Um die neue nicht standardmäßige Bereitstellung zu testen, müssen Sie den Namen der auszuführenden Bereitstellung kennen.

DEPLOYMENT_NAME="mnist-keras-dpl"
JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --deployment-name $DEPLOYMENT_NAME --input https://azuremlexampledata.blob.core.windows.net/data/mnist/sample --input-type uri_folder --query name -o tsv)

Beachten Sie, dass für die Angabe der auszuführenden Bereitstellung --deployment-name verwendet wird. Mit diesem Parameter können Sie eine nicht standardmäßige Bereitstellung aufrufen (invoke), ohne die Standardbereitstellung des Batchendpunkts zu aktualisieren.

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint_name,
    deployment_name=deployment_keras.name,
    input=Input(
        path="https://azuremlexampledata.blob.core.windows.net/data/mnist/sample/",
        type=AssetTypes.URI_FOLDER,
    ),
)

Beachten Sie, dass für die Angabe der auszuführenden Bereitstellung deployment_name verwendet wird. Mit diesem Parameter können Sie eine nicht standardmäßige Bereitstellung aufrufen (invoke), ohne die Standardbereitstellung des Batchendpunkts zu aktualisieren.

Navigieren Sie im Seitenmenü zur Registerkarte Endpunkte.
Wählen Sie die Registerkarte Batchendpunkte aus.
Wählen Sie den Endpunkt aus, den Sie gerade erstellt haben.
Klicken Sie auf Auftrag erstellen.
Wählen Sie unter Bereitstellung die auszuführende Bereitstellung aus. In diesem Fall mnist-keras.
Schließen Sie den Assistenten zum Erstellen von Aufträgen ab, um den Auftrag zu starten.

Aktualisieren der Standard-Batchbereitstellung

Sie können zwar eine bestimmte Bereitstellung innerhalb eines Endpunkts aufrufen, in der Regel rufen Sie jedoch den Endpunkt selbst auf und überlassen diesem die Entscheidung, welche Bereitstellung verwendet werden soll. Der Endpunkt verwendet dann die Standardbereitstellung. Sie können die Standardbereitstellung (und damit das Modell für die Bereitstellung) ändern, ohne Ihren Vertrag mit dem Benutzer oder der Benutzerin zu ändern, der bzw. die den Endpunkt aufruft. Verwenden Sie den folgenden Code, um die Standardbereitstellung zu ändern:

az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME

endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment_keras.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()

Löschen des Batchendpunkts und der Bereitstellung

Wenn Sie die alte Batchbereitstellung nicht weiter verwenden möchten, löschen Sie sie, indem Sie den folgenden Code ausführen. --yes wird verwendet, um den Löschvorgang zu bestätigen.

az ml batch-deployment delete --name mnist-torch-dpl --endpoint-name $ENDPOINT_NAME --yes

Führen Sie den folgenden Code aus, um den Batchendpunkt und alle seine zugrunde liegenden Bereitstellungen zu löschen. Batchbewertungsaufträge werden nicht gelöscht.

az ml batch-endpoint delete --name $ENDPOINT_NAME --yes

Wenn Sie die alte Batchbereitstellung nicht weiter verwenden möchten, löschen Sie sie, indem Sie den folgenden Code ausführen.

ml_client.batch_deployments.begin_delete(
    endpoint_name=endpoint_name, name=deployment.name
).result()

Führen Sie den folgenden Code aus, um den Batchendpunkt und alle seine zugrunde liegenden Bereitstellungen zu löschen. Batchbewertungsaufträge werden nicht gelöscht.

ml_client.batch_endpoints.begin_delete(name=endpoint_name)

Freigeben über

Bereitstellen von Modellen für die Bewertung in Batchendpunkten

Voraussetzungen

Klonen des Beispielrepositorys

Vorbereiten Ihres Systems

Herstellen einer Verbindung mit Ihrem Arbeitsbereich

Erstellen von Computeressourcen

Erstellen eines Batchendpunkts

Erstellen einer Batchbereitstellung

Ausführen von Batch-Endpunkten und Zugreifen auf Ergebnisse

Überwachen des Ausführungsfortschritts des Batch-Auftrags

Überprüfen der Ergebnisse der Batchbewertung

Konfigurieren des Ausgabespeicherorts

Außerkraftsetzen der Bereitstellungskonfiguration pro Auftrag

Hinzufügen von Bereitstellungen zu einem Endpunkt

Hinzufügen einer zweiten Bereitstellung

Testen einer nicht standardmäßigen Batchbereitstellung

Aktualisieren der Standard-Batchbereitstellung

Löschen des Batchendpunkts und der Bereitstellung

Feedback

Zusätzliche Ressourcen

Freigeben über

Bereitstellen von Modellen für die Bewertung in Batchendpunkten

Voraussetzungen

Klonen des Beispielrepositorys

Vorbereiten Ihres Systems

Herstellen einer Verbindung mit Ihrem Arbeitsbereich

Erstellen von Computeressourcen

Erstellen eines Batchendpunkts

Erstellen einer Batchbereitstellung

Ausführen von Batch-Endpunkten und Zugreifen auf Ergebnisse

Überwachen des Ausführungsfortschritts des Batch-Auftrags

Überprüfen der Ergebnisse der Batchbewertung

Konfigurieren des Ausgabespeicherorts

Außerkraftsetzen der Bereitstellungskonfiguration pro Auftrag

Hinzufügen von Bereitstellungen zu einem Endpunkt

Hinzufügen einer zweiten Bereitstellung

Testen einer nicht standardmäßigen Batchbereitstellung

Aktualisieren der Standard-Batchbereitstellung

Löschen des Batchendpunkts und der Bereitstellung

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen