AzureBatchStep Classe
Cria um passo do Pipeline do Azure ML para submeter tarefas para Azure Batch.
Nota: este passo não suporta o carregamento/transferência de diretórios e respetivos conteúdos.
Para obter um exemplo de utilização do AzureBatchStep, veja o bloco de notas https://aka.ms/pl-azbatch.
Crie um passo do Pipeline do Azure ML para submeter tarefas para Azure Batch.
- Herança
-
azureml.pipeline.core._azurebatch_step_base._AzureBatchStepBaseAzureBatchStep
Construtor
AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)
Parâmetros
Name | Description |
---|---|
name
Necessário
|
[Obrigatório] O nome do passo. |
create_pool
|
Indica se deve criar o conjunto antes de executar as tarefas. Default value: False
|
pool_id
|
[Obrigatório] O ID do conjunto onde a tarefa é executada. O ID pode ser um conjunto existente ou um que será criado quando a tarefa for submetida. Default value: None
|
delete_batch_job_after_finish
|
Indica se pretende eliminar a tarefa da conta do Batch depois de terminar. Default value: True
|
delete_batch_pool_after_finish
|
Indica se pretende eliminar o conjunto após a conclusão da tarefa. Default value: False
|
is_positive_exit_code_failure
|
Indica se a tarefa falha se a tarefa existir com um código positivo. Default value: True
|
vm_image_urn
|
Se Default value: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
|
run_task_as_admin
|
Indica se a tarefa deve ser executada com privilégios de administrador. Default value: False
|
target_compute_nodes
|
Se Default value: 1
|
vm_size
|
Se Default value: standard_d1_v2
|
source_directory
|
Uma pasta local que contém os binários do módulo, executáveis, assemblagens, etc. Default value: None
|
executable
|
[Obrigatório] O nome do comando/executável que será executado como parte da tarefa. Default value: None
|
arguments
|
Argumentos para o comando/executável. Default value: None
|
inputs
|
Uma lista de enlaces de portas de entrada. Antes da execução da tarefa, é criada uma pasta para cada entrada. Os ficheiros para cada entrada serão copiados do armazenamento para a respetiva pasta no nó de computação. Por exemplo, se o nome da entrada for input1 e o caminho relativo no armazenamento for algum/relativo/caminho/que/pode/ser/realmente/longo/inputfile.txt, o caminho do ficheiro na computação será: ./input1/inputfile.txt. Quando o nome de entrada tiver mais de 32 carateres, será truncado e anexado com um sufixo exclusivo para que o nome da pasta possa ser criado com êxito no destino de computação. Default value: None
|
outputs
|
Uma lista de enlaces de portas de saída. Semelhante às entradas, antes da execução da tarefa, é criada uma pasta para cada saída. O nome da pasta será o mesmo que o nome de saída. O pressuposto é que a tarefa colocará o resultado nessa pasta. Default value: None
|
allow_reuse
|
Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições. A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização é determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados. Default value: True
|
compute_target
|
[Obrigatório] Uma computação BatchCompute onde a tarefa é executada. Default value: None
|
version
|
Uma etiqueta de versão opcional para denotar uma alteração na funcionalidade do módulo. Default value: None
|
name
Necessário
|
[Obrigatório] O nome do passo. |
create_pool
Necessário
|
Indica se deve criar o conjunto antes de executar as tarefas. |
pool_id
Necessário
|
[Obrigatório] O ID do conjunto onde a tarefa é executada. O ID pode ser um conjunto existente ou um que será criado quando a tarefa for submetida. |
delete_batch_job_after_finish
Necessário
|
Indica se pretende eliminar a tarefa da conta do Batch depois de terminar. |
delete_batch_pool_after_finish
Necessário
|
Indica se pretende eliminar o conjunto após a conclusão da tarefa. |
is_positive_exit_code_failure
Necessário
|
Indica se a tarefa falha se a tarefa existir com um código positivo. |
vm_image_urn
Necessário
|
Se |
run_task_as_admin
Necessário
|
Indica se a tarefa deve ser executada com privilégios de administrador. |
target_compute_nodes
Necessário
|
Se |
vm_size
Necessário
|
Se |
source_directory
Necessário
|
Uma pasta local que contém os binários do módulo, executáveis, assemblagens, etc. |
executable
Necessário
|
[Obrigatório] O nome do comando/executável que será executado como parte da tarefa. |
arguments
Necessário
|
Argumentos para o comando/executável. |
inputs
Necessário
|
Uma lista de enlaces de portas de entrada. Antes da execução da tarefa, é criada uma pasta para cada entrada. Os ficheiros para cada entrada serão copiados do armazenamento para a respetiva pasta no nó de computação. Por exemplo, se o nome da entrada for input1 e o caminho relativo no armazenamento for algum/relativo/caminho/que/pode/ser/realmente/longo/inputfile.txt, o caminho do ficheiro na computação será: ./input1/inputfile.txt. Caso o nome de entrada tenha mais de 32 carateres, será truncado e anexado com um sufixo exclusivo, pelo que o nome da pasta pode ser criado com êxito na computação. |
outputs
Necessário
|
Uma lista de enlaces de portas de saída. Semelhante às entradas, antes da execução da tarefa, é criada uma pasta para cada saída. O nome da pasta será o mesmo que o nome de saída. O pressuposto é que a tarefa terá o resultado nessa pasta. |
allow_reuse
Necessário
|
Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições. A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização é determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados. |
compute_target
Necessário
|
[Obrigatório] Uma computação BatchCompute onde a tarefa é executada. |
version
Necessário
|
Uma etiqueta de versão opcional para denotar uma alteração na funcionalidade do módulo. |
Observações
O exemplo seguinte mostra como utilizar o AzureBatchStep num Pipeline do Azure Machine Learning.
step = AzureBatchStep(
name="Azure Batch Job",
pool_id="MyPoolName", # Replace this with the pool name of your choice
inputs=[testdata],
outputs=[outputdata],
executable="azurebatch.cmd",
arguments=[testdata, outputdata],
compute_target=batch_compute,
source_directory=binaries_folder,
)
O exemplo completo está disponível a partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb
Métodos
create_node |
Crie um nó a partir do passo AzureBatch e adicione-o ao gráfico especificado. Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com este passo, o Azure ML transmite automaticamente os parâmetros necessários através deste método para que esse passo possa ser adicionado a um gráfico de pipeline que representa o fluxo de trabalho. |
create_node
Crie um nó a partir do passo AzureBatch e adicione-o ao gráfico especificado.
Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com este passo, o Azure ML transmite automaticamente os parâmetros necessários através deste método para que esse passo possa ser adicionado a um gráfico de pipeline que representa o fluxo de trabalho.
create_node(graph, default_datastore, context)
Parâmetros
Name | Description |
---|---|
graph
Necessário
|
O objeto de gráfico ao que adicionar o nó. |
default_datastore
Necessário
|
O arquivo de dados predefinido. |
context
Necessário
|
<xref:azureml.pipeline.core._GraphContext>
O contexto do gráfico. |
Devoluções
Tipo | Description |
---|---|
O nó criado. |