Wdrażanie istniejących zadań potoku w punktach końcowych wsadowych

Artykuł
12/19/2024

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

Punkty końcowe usługi Batch umożliwiają wdrażanie składników potoku, zapewniając wygodny sposób operacjonalizacji potoków w usłudze Azure Machine Learning. Punkty końcowe usługi Batch akceptują składniki potoku do wdrożenia. Jeśli jednak masz już zadanie potoku, które działa pomyślnie, usługa Azure Machine Learning może zaakceptować to zadanie jako dane wejściowe punktu końcowego wsadowego i automatycznie utworzyć składnik potoku. W tym artykule dowiesz się, jak używać istniejącego zadania potoku jako danych wejściowych do wdrożenia wsadowego.

Dowiesz się, jak wykonywać następujące czynności:

Uruchamianie i tworzenie zadania potoku, które chcesz wdrożyć
Tworzenie wdrożenia wsadowego na podstawie istniejącego zadania
Testowanie wdrożenia

Informacje o tym przykładzie

W tym przykładzie wdrożymy potok składający się z prostego zadania polecenia, które wyświetla tekst "hello world!". Zamiast rejestrować składnik potoku przed wdrożeniem, wskazujemy istniejące zadanie potoku do użycia na potrzeby wdrożenia. Usługa Azure Machine Learning automatycznie utworzy składnik potoku i wdroży go jako wdrożenie składnika potoku punktu końcowego wsadowego.

Przykład w tym artykule jest oparty na przykładach kodu zawartych w repozytorium azureml-examples . Aby uruchomić polecenia lokalnie bez konieczności kopiowania lub wklejania kodu YAML i innych plików, użyj następujących poleceń, aby sklonować repozytorium i przejść do folderu dla języka kodowania:

Interfejs wiersza polecenia platformy Azure
Python

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/sdk/python

Pliki dla tego przykładu znajdują się w następujących elementach:

cd endpoints/batch/deploy-pipelines/hello-batch

Wymagania wstępne

Subskrypcja platformy Azure. Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Obszar roboczy usługi Azure Machine Learning. Aby utworzyć obszar roboczy, zobacz Zarządzanie obszarami roboczymi usługi Azure Machine Learning.
Następujące uprawnienia w obszarze roboczym usługi Azure Machine Learning:
- Do tworzenia punktów końcowych i wdrożeń wsadowych lub zarządzania nimi: użyj roli właściciela, współautora lub niestandardowej, która została przypisana Microsoft.MachineLearningServices/workspaces/batchEndpoints/* do uprawnień.
- Aby utworzyć wdrożenia usługi Azure Resource Manager w grupie zasobów obszaru roboczego: użyj roli właściciel, współautor lub niestandardowa, która została przypisana Microsoft.Resources/deployments/write do uprawnienia w grupie zasobów, w której wdrożono obszar roboczy.
Interfejs wiersza polecenia usługi Azure Machine Learning lub zestaw AZURE Machine Learning SDK dla języka Python:
- Interfejs wiersza polecenia platformy Azure
- Python
Uruchom następujące polecenie, aby zainstalować interfejs wiersza polecenia platformy Azure i ml rozszerzenie usługi Azure Machine Learning:
```
az extension add -n ml
```
Wdrożenia składników potoku dla punktów końcowych wsadowych są wprowadzane w wersji 2.7 ml rozszerzenia dla interfejsu wiersza polecenia platformy Azure. Użyj polecenia , az extension update --name ml aby pobrać najnowszą wersję.
Uruchom następujące polecenie, aby zainstalować zestaw AZURE Machine Learning SDK dla języka Python:
```
pip install azure-ai-ml
```
Klasy ModelBatchDeployment i PipelineComponentBatchDeployment są wprowadzane w wersji 1.7.0 zestawu SDK. Użyj polecenia , pip install -U azure-ai-ml aby pobrać najnowszą wersję.

Nawiązywanie połączenia z obszarem roboczym

Obszar roboczy to zasób najwyższego poziomu dla usługi Azure Machine Learning. Zapewnia scentralizowane miejsce do pracy ze wszystkimi artefaktami tworzonymi podczas korzystania z usługi Azure Machine Learning. W tej sekcji nawiąż połączenie z obszarem roboczym, w którym wykonujesz zadania wdrażania.

Interfejs wiersza polecenia platformy Azure
Python

W poniższym poleceniu wprowadź identyfikator subskrypcji, nazwę obszaru roboczego, nazwę grupy zasobów i lokalizację:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Zaimportuj wymagane biblioteki:

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Skonfiguruj szczegóły obszaru roboczego i uzyskaj dojście do obszaru roboczego:

W poniższym poleceniu wprowadź identyfikator subskrypcji, nazwę grupy zasobów i nazwę obszaru roboczego:
```
subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
```

Uruchamianie zadania potoku, które chcesz wdrożyć

W tej sekcji rozpoczniemy od uruchomienia zadania potoku:

Interfejs wiersza polecenia platformy Azure
Python

Następujący pipeline-job.yml plik zawiera konfigurację zadania potoku:

pipeline-job.yml

$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline

experiment_name: hello-pipeline-batch
display_name: hello-pipeline-batch-job
description: This job demonstrates how to run the a pipeline component in a pipeline job. You can use this example to test a component in an standalone job before deploying it in an endpoint.

compute: batch-cluster
component: hello-component/hello.yml

Załaduj składnik potoku i utwórz jego wystąpienie:

hello_batch = load_component(source="hello-component/hello.yml")
pipeline_job = hello_batch()

Teraz skonfiguruj niektóre ustawienia uruchamiania, aby uruchomić test. W tym artykule założono, że masz klaster obliczeniowy o nazwie batch-cluster. Klaster można zastąpić nazwą Twoich.

pipeline_job.settings.default_compute = "batch-cluster"
pipeline_job.settings.default_datastore = "workspaceblobstore"

Utwórz zadanie potoku:

Interfejs wiersza polecenia platformy Azure
Python

JOB_NAME=$(az ml job create -f pipeline-job.yml --query name -o tsv)

pipeline_job_run = ml_client.jobs.create_or_update(
    pipeline_job, experiment_name="hello-batch-pipeline"
)
pipeline_job_run

Tworzenie punktu końcowego wsadowego

Przed wdrożeniem zadania potoku musimy wdrożyć punkt końcowy wsadowy w celu hostowania wdrożenia.

Podaj nazwę punktu końcowego. Nazwa punktu końcowego partii musi być unikatowa w każdym regionie, ponieważ nazwa jest używana do konstruowania identyfikatora URI wywołania. Aby zapewnić unikatowość, dołącz wszystkie końcowe znaki do nazwy określonej w poniższym kodzie.
- Interfejs wiersza polecenia platformy Azure
- Python
```
ENDPOINT_NAME="hello-batch"
```
```
endpoint_name="hello-batch"
```

Konfigurowanie punktu końcowego:

Interfejs wiersza polecenia platformy Azure
Python

Plik endpoint.yml zawiera konfigurację punktu końcowego.

endpoint.yml

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: hello-batch
description: A hello world endpoint for component deployments.
auth_mode: aad_token

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A hello world endpoint for component deployments",
)

Utwórz punkt końcowy:

Interfejs wiersza polecenia platformy Azure
Python

az ml batch-endpoint create --name $ENDPOINT_NAME  -f endpoint.yml

ml_client.batch_endpoints.begin_create_or_update(endpoint).result()

Wykonaj zapytanie dotyczące identyfikatora URI punktu końcowego:

Interfejs wiersza polecenia platformy Azure
Python

az ml batch-endpoint show --name $ENDPOINT_NAME

endpoint = ml_client.batch_endpoints.get(name=endpoint_name)
print(endpoint)

Wdrażanie zadania potoku

Aby wdrożyć składnik potoku, musimy utworzyć wdrożenie wsadowe z istniejącego zadania.

Musimy poinformować usługę Azure Machine Learning o nazwie zadania, które chcemy wdrożyć. W naszym przypadku to zadanie jest wskazane w następującej zmiennej:
- Interfejs wiersza polecenia platformy Azure
- Python
```
echo $JOB_NAME
```
```
print(job.name)
```

Skonfiguruj wdrożenie.

Interfejs wiersza polecenia platformy Azure
Python

Plik deployment-from-job.yml zawiera konfigurację wdrożenia. Zwróć uwagę, że używamy klucza job_definition zamiast component wskazywać, że to wdrożenie zostało utworzone na podstawie zadania potoku:

deployment-from-job.yml

$schema: https://azuremlschemas.azureedge.net/latest/pipelineComponentBatchDeployment.schema.json
name: hello-batch-from-job
endpoint_name: hello-pipeline-batch
type: pipeline
job_definition: azureml:job_name_placeholder
settings:
    continue_on_step_failure: false
    default_compute: batch-cluster

Zwróć uwagę, że teraz używamy właściwości job_definition zamiast component:

deployment = PipelineComponentBatchDeployment(
    name="hello-batch-from-job",
    description="A hello world deployment with a single step. This deployment is created from a pipeline job.",
    endpoint_name=endpoint.name,
    job_definition=pipeline_job_run,
    settings={
        "default_compute": "batch-cluster",
        "continue_on_step_failure": False
    }
)

Napiwek

Ta konfiguracja zakłada, że masz klaster obliczeniowy o nazwie batch-cluster. Możesz zastąpić tę wartość nazwą klastra.

Utwórz wdrożenie:
- Interfejs wiersza polecenia platformy Azure
- Python
Uruchom następujący kod, aby utworzyć wdrożenie wsadowe w punkcie końcowym wsadowym i ustawić je jako domyślne wdrożenie.
```
az ml batch-deployment create --endpoint $ENDPOINT_NAME --set job_definition=azureml:$JOB_NAME -f deployment-from-job.yml
```
Napiwek

Zwróć uwagę na użycie polecenia --set job_definition=azureml:$JOB_NAME. Ponieważ nazwy zadań są unikatowe, polecenie --set służy tutaj do zmiany nazwy zadania podczas uruchamiania go w obszarze roboczym.
To polecenie uruchamia tworzenie wdrożenia i zwraca odpowiedź potwierdzenia, gdy tworzenie wdrożenia będzie kontynuowane.
```
ml_client.batch_deployments.begin_create_or_update(deployment).result()
```
Po utworzeniu skonfigurujmy to nowe wdrożenie jako domyślne:
```
endpoint = ml_client.batch_endpoints.get(endpoint.name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
Wdrożenie jest gotowe do użycia.

Testowanie wdrożenia

Po utworzeniu wdrożenia można przystąpić do odbierania zadań. Wdrożenie domyślne można wywołać w następujący sposób:

Interfejs wiersza polecenia platformy Azure
Python

JOB_NAME=$(az ml batch-endpoint invoke -n $ENDPOINT_NAME --query name -o tsv)

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name, 
)

Możesz monitorować postęp wyświetlania i przesyłać strumieniowo dzienniki przy użyciu:

Interfejs wiersza polecenia platformy Azure
Python

az ml job stream -n $JOB_NAME

ml_client.jobs.get(name=job.name)

Aby poczekać na zakończenie zadania, uruchom następujący kod:

ml_client.jobs.stream(name=job.name)

Czyszczenie zasobów

Po zakończeniu usuń skojarzone zasoby z obszaru roboczego:

Interfejs wiersza polecenia platformy Azure
Python

Uruchom następujący kod, aby usunąć punkt końcowy wsadowy i jego bazowe wdrożenie. --yes służy do potwierdzania usunięcia.

az ml batch-endpoint delete -n $ENDPOINT_NAME --yes

Usuń punkt końcowy:

ml_client.batch_endpoints.begin_delete(endpoint.name).result()

Udostępnij za pośrednictwem