OutputPortBinding Класс
Определяет именованные выходные данные этапа конвейера.
Класс OutputPortBinding позволяет задать тип данных, которые будут создаваться на этапе, и способ их создания. Его можно использовать с InputPortBinding, чтобы указать, что выходные данные этапа являются обязательными входными данными для другого этапа.
Инициализация OutputPortBinding.
- Наследование
-
builtins.objectOutputPortBinding
Конструктор
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Параметры
Имя | Описание |
---|---|
name
Обязательно
|
Имя объекта OutputPortBinding, которое может содержать только буквы, цифры и символы подчеркивания. |
datastore
|
Хранилище данных, в котором будет размещаться PipelineData. Default value: None
|
output_name
|
При значении None используется имя выходных данных. Может содержать только буквы, цифры и символы подчеркивания. Default value: None
|
bind_mode
|
Указывает, будет ли этап создания использовать для доступа к данным метод "upload", "mount" или "hdfs". Default value: mount
|
path_on_compute
|
Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные. Default value: None
|
is_directory
|
Являются ли выходные данные каталогом или отдельным файлом. Default value: None
|
overwrite
|
Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные. Default value: None
|
data_type
|
Необязательный элемент. Тип данных можно использовать для указания ожидаемого типа выходных данных, а также для детализации способа использования данных соответствующими этапами. Это может быть любая определяемая пользователем строка. Default value: None
|
pipeline_output_name
|
Если этот параметр указан, выходные данные будут доступны с помощью PipelineRun.get_pipeline_output(). Имена выходных данных конвейера должны быть уникальными в рамках конвейера. Default value: None
|
training_output
|
Определяет выходные данные для результатов обучения. Это необходимо только для конкретных видов обучения с различными типами выходных данных, таким как метрики и модели. Например, результат AutoMLStep — создание метрик и модели. Можно также определить конкретную итерацию или метрику обучения, используемую для получения оптимальной модели. Для HyperDriveStep можно также определить конкретные файлы модели, которые будут включаться в выходные данные. Default value: None
|
dataset_registration
|
Необязательный элемент. Это внутренний параметр. Вместо него следует использовать PipelineData.as_dataset. Default value: None
|
dataset_output
|
Необязательный элемент. Это внутренний параметр. Вместо него следует использовать OutputFileDatasetConfig. Default value: None
|
name
Обязательно
|
Имя объекта OutputPortBinding, которое может содержать только буквы, цифры и символы подчеркивания. |
datastore
Обязательно
|
Хранилище данных, в котором будет размещаться PipelineData. |
output_name
Обязательно
|
При значении None используется имя выходных данных. Может содержать только буквы, цифры и символы подчеркивания. |
bind_mode
Обязательно
|
Указывает, будет ли этап создания использовать для доступа к данным метод "upload", "mount" или "hdfs". |
path_on_compute
Обязательно
|
Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные. |
is_directory
Обязательно
|
Значение , если выходные данные являются каталогом |
overwrite
Обязательно
|
Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные. |
data_type
Обязательно
|
Необязательный элемент. Тип данных можно использовать для указания ожидаемого типа выходных данных, а также для детализации способа использования данных соответствующими этапами. Это может быть любая определяемая пользователем строка. |
pipeline_output_name
Обязательно
|
Если этот параметр указан, выходные данные будут доступны с помощью PipelineRun.get_pipeline_output(). Имена выходных данных конвейера должны быть уникальными в рамках конвейера. |
training_output
Обязательно
|
Определяет выходные данные для результатов обучения. Это необходимо только для конкретных видов обучения с различными типами выходных данных, таким как метрики и модели. Например, результат AutoMLStep — создание метрик и модели. Можно также определить конкретную итерацию или метрику обучения, используемую для получения оптимальной модели. Для HyperDriveStep можно также определить конкретные файлы модели, которые будут включаться в выходные данные. |
dataset_registration
Обязательно
|
Необязательный элемент. Это внутренний параметр. Вместо него следует использовать PipelineData.as_dataset. |
dataset_output
Обязательно
|
Необязательный элемент. Это внутренний параметр. Вместо него следует использовать OutputFileDatasetConfig. |
Комментарии
OutputPortBinding можно использовать таким же образом, как PipelineData, при построении конвейера для указания входных и выходных данных этапа. Разница заключается в том, что OutputPortBinding необходимо использовать с InputPortBinding для использования в качестве входных данных для другого этапа.
Пример создания конвейера с помощью OutputPortBinding выглядит следующим образом:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Будет создан конвейер с двумя этапами. В первую очередь выполняется этап обработки, а после его завершения выполняется этап обучения. Azure ML предоставит выходные данные, созданные на этапе обработки, как описано в объекте OutputPortBinding, на этап обучения.
Атрибуты
bind_mode
Получение режима ("upload", "mount" или "hdfs"), который будет использоваться для создания данных.
Возвращаемое значение
Тип | Описание |
---|---|
Режим привязки. |
data_type
Получение типа данных, которые будут созданы.
Возвращаемое значение
Тип | Описание |
---|---|
Имя типа данных. |
dataset_registration
Получение сведений о регистрации набора данных.
Возвращаемое значение
Тип | Описание |
---|---|
Сведения о регистрации набора данных. |
datastore
Хранилище данных, в котором будет размещаться PipelineData.
Возвращаемое значение
Тип | Описание |
---|---|
Объект хранилища данных. |
is_directory
name
overwrite
Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные.
Возвращаемое значение
Тип | Описание |
---|---|
_overwrite |
path_on_compute
Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные.
Возвращаемое значение
Тип | Описание |
---|---|
path_on_compute |
pipeline_output_name
Получение имени выходных данных конвейера, соответствующих этому объекту OutputPortBinding.
Возвращаемое значение
Тип | Описание |
---|---|
Имя выходных данных конвейера. |
training_output
Получение выходных данных обучения.
Возвращаемое значение
Тип | Описание |
---|---|
Выходные данные обучения |