EstimatorStep Klasse
VERALTET. Erstellt einen Pipelineschritt, der Estimator für das Training eines Azure ML-Modells ausführt.
Erstellen Sie einen Azure ML Pipeline-Schritt, um das Estimator for Machine Learning-Modelltraining auszuführen.
VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter How to run ML training in pipelines with CommandStep (Ausführen von ML-Trainings in Pipelines mit CommandStep).
- Vererbung
-
EstimatorStep
Konstruktor
EstimatorStep(name=None, estimator=None, estimator_entry_script_arguments=None, runconfig_pipeline_params=None, inputs=None, outputs=None, compute_target=None, allow_reuse=True, version=None)
Parameter
Name | Beschreibung |
---|---|
name
|
Der Name des Schritts. Standardwert: None
|
estimator
|
Das zugeordnete estimator-Objekt für diesen Schritt. Kann ein vorkonfigurierter Schätzer wie Chainer, PyTorch, TensorFlow oder SKLearn sein. Standardwert: None
|
estimator_entry_script_arguments
|
[Erforderlich] Eine Liste der Befehlszeilenargumente. Wenn das Eingabeskript des Schätzers keine Befehlszeilenargumente akzeptiert, legen Sie diesen Parameterwert auf eine leere Liste fest. Standardwert: None
|
runconfig_pipeline_params
|
Eine Überschreibung von runconfig-Eigenschaften zur Laufzeit unter Verwendung von Schlüssel-Wert-Paaren mit jeweils dem Namen der runconfig-Eigenschaft und dem PipelineParameter für diese Eigenschaft. Unterstützte Werte: „NodeCount“, „MpiProcessCountPerNode“, „TensorflowWorkerCount“, „TensorflowParameterServerCount“ Standardwert: None
|
inputs
|
Eine Liste der zu verwendende Eingaben. Standardwert: None
|
outputs
|
Eine Liste von PipelineData-Objekten. Standardwert: None
|
compute_target
|
[Erforderlich] Das zu verwendende Computeziel. Standardwert: None
|
allow_reuse
|
Gibt an, ob bei dem Schritt vorherige Ergebnisse wiederverwendet werden sollen, wenn er mit den gleichen Einstellungen erneut ausgeführt wird. Die Wiederverwendung ist standardmäßig aktiviert. Wenn der Schrittinhalt (Skripts/Abhängigkeiten) sowie die Eingaben und Parameter unverändert bleiben, wird die Ausgabe der vorherigen Ausführung dieses Schritts wiederverwendet. Wenn Sie den Schritt wiederverwenden, anstatt den Auftrag zum Berechnen zu übermitteln, werden die Ergebnisse der vorherigen Ausführung sofort für alle nachfolgenden Schritte verfügbar gemacht. Wenn Sie Azure Machine Learning-Datasets als Eingaben verwenden, hängt die Wiederverwendung nicht davon ab, ob sich die zugrunde liegenden Daten geändert haben, sondern davon, ob sich die Definition des Datasets geändert hat. Standardwert: True
|
version
|
Ein optionales Versionstag, um eine Änderung der Funktionalität für das Modul zu kennzeichnen. Standardwert: None
|
name
Erforderlich
|
Der Name des Schritts. |
estimator
Erforderlich
|
<xref:Estimator>
Das zugeordnete estimator-Objekt für diesen Schritt. Kann ein vorkonfigurierter Schätzer wie Chainer, PyTorch, TensorFlow oder SKLearn sein. |
estimator_entry_script_arguments
Erforderlich
|
[str]
[Erforderlich] Eine Liste der Befehlszeilenargumente. Wenn das Eingabeskript des Schätzers keine Befehlszeilenargumente akzeptiert, legen Sie diesen Parameterwert auf eine leere Liste fest. |
runconfig_pipeline_params
Erforderlich
|
Eine Überschreibung von runconfig-Eigenschaften zur Laufzeit unter Verwendung von Schlüssel-Wert-Paaren mit jeweils dem Namen der runconfig-Eigenschaft und dem PipelineParameter für diese Eigenschaft. Unterstützte Werte: „NodeCount“, „MpiProcessCountPerNode“, „TensorflowWorkerCount“, „TensorflowParameterServerCount“ |
inputs
Erforderlich
|
list[Union[PipelineData, PipelineOutputAbstractDataset, DataReference, DatasetConsumptionConfig, PipelineOutputTabularDataset, PipelineOutputFileDataset]]
Eine Liste der zu verwendende Eingaben. |
outputs
Erforderlich
|
Eine Liste von PipelineData-Objekten. |
compute_target
Erforderlich
|
[Erforderlich] Das zu verwendende Computeziel. |
allow_reuse
Erforderlich
|
Gibt an, ob bei dem Schritt vorherige Ergebnisse wiederverwendet werden sollen, wenn er mit den gleichen Einstellungen erneut ausgeführt wird. Die Wiederverwendung ist standardmäßig aktiviert. Wenn der Schrittinhalt (Skripts/Abhängigkeiten) sowie die Eingaben und Parameter unverändert bleiben, wird die Ausgabe der vorherigen Ausführung dieses Schritts wiederverwendet. Wenn Sie den Schritt wiederverwenden, anstatt den Auftrag zum Berechnen zu übermitteln, werden die Ergebnisse der vorherigen Ausführung sofort für alle nachfolgenden Schritte verfügbar gemacht. Wenn Sie Azure Machine Learning-Datasets als Eingaben verwenden, hängt die Wiederverwendung nicht davon ab, ob sich die zugrunde liegenden Daten geändert haben, sondern davon, ob sich die Definition des Datasets geändert hat. |
version
Erforderlich
|
version |
Hinweise
Beachten Sie, dass die Argumente für das im Estimator-Objekt verwendete Einstiegsskript beim Instanziieren eines EstimatorStep als Liste mithilfe des estimator_entry_script_arguments
-Parameters angegeben werden müssen. Der Estimator-Parameter script_params
akzeptiert ein Wörterbuch. Der estimator_entry_script_argument
-Parameter erwartet jedoch die Argumente als Liste.
Die EstimatorStep-Initialisierung umfasst das Angeben einer Liste von Eingaben mit dem inputs
-Parameter. Außerdem müssen Sie die Eingaben nicht mit dem Schätzer angeben, da andernfalls eine Ausnahme ausgelöst wird. Die zulässigen Eingabetypen finden Sie unter dem inputs
-Parameter. Optional können Sie auch alle Ausgaben für den Schritt angeben. Die zulässigen Ausgabetypen finden Sie unter dem outputs
-Parameter.
Als bewährte Methode für die Arbeit mit EstimatorStep gilt die Verwendung eines separaten Ordners für Skripts und alle abhängigen Dateien, die dem Schritt zugeordnet sind, und das Angeben dieses Ordners als source_directory
des Estimator-Objekts. Dies bietet zwei Vorteile. Erstens kann die Größe der für den Schritt erstellten Momentaufnahme reduziert werden, da nur die für den Schritt benötigte Momentaufnahme erstellt wird. Zweitens kann die Ausgabe des Schritts aus einer vorherigen Ausführung wiederverwendet werden, wenn keine Änderungen am source_directory
vorgenommen wurden, die einen erneuten Upload der Momentaufnahme auslösen würden.
Methoden
create_node |
Erstellt einen Knoten aus dem Estimator-Schritt und fügt ihn dem angegebenen Graphen hinzu. VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter How to run ML training in pipelines with CommandStep (Ausführen von ML-Trainings in Pipelines mit CommandStep). Diese Methode ist nicht für die direkte Nutzung vorgesehen. Wenn eine Pipeline mit diesem Schritt instanziiert wird, werden von Azure ML automatisch die für diese Methode erforderlichen Parameter übergeben, damit der Schritt einem Pipelinegraphen hinzugefügt werden kann, der den Workflow darstellt. |
create_node
Erstellt einen Knoten aus dem Estimator-Schritt und fügt ihn dem angegebenen Graphen hinzu.
VERALTET. Verwenden Sie stattdessen CommandStep. Ein Beispiel finden Sie unter How to run ML training in pipelines with CommandStep (Ausführen von ML-Trainings in Pipelines mit CommandStep).
Diese Methode ist nicht für die direkte Nutzung vorgesehen. Wenn eine Pipeline mit diesem Schritt instanziiert wird, werden von Azure ML automatisch die für diese Methode erforderlichen Parameter übergeben, damit der Schritt einem Pipelinegraphen hinzugefügt werden kann, der den Workflow darstellt.
create_node(graph, default_datastore, context)
Parameter
Name | Beschreibung |
---|---|
graph
Erforderlich
|
Das Graphobjekt, dem der Knoten hinzugefügt werden soll. |
default_datastore
Erforderlich
|
Der Standarddatenspeicher. |
context
Erforderlich
|
<xref:azureml.pipeline.core._GraphContext>
Der Graphkontext. |
Gibt zurück
Typ | Beschreibung |
---|---|
Der erstellte Knoten. |