Freigeben über


OutputPortBinding Klasse

Definiert eine benannte Ausgabe eines Pipelineschritts.

Mit OutputPortBinding können Sie den Datentyp angeben, der von einem Schritt generiert wird, und festlegen, wie die Daten generiert werden. Sie kann mit InputPortBinding verwendet werden, um anzugeben, dass die Schrittausgabe eine erforderliche Eingabe eines anderen Schritts ist.

Initialisieren Sie OutputPortBinding.

Vererbung
builtins.object
OutputPortBinding

Konstruktor

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Parameter

Name Beschreibung
name
Erforderlich
str

Der Name des OutputPortBinding-Objekts, der nur Buchstaben, Ziffern und Unterstriche enthalten darf.

datastore

Der Datenspeicher, in dem sich die PipelineData befinden werden.

Standardwert: None
output_name
str

Der Name der Ausgabe, wenn der Name „None“ ist. Darf nur Buchstaben, Ziffern und Unterstriche enthalten.

Standardwert: None
bind_mode
str

Gibt an, ob der Erstellungsschritt die Methode „upload“ oder „mount“ oder „hdfs“ verwendet, um auf die Daten zuzugreifen.

Standardwert: mount
path_on_compute
str

Für den „upload“-Modus: der Pfad, in den das Modul die Ausgabe schreibt.

Standardwert: None
is_directory

Gibt an, ob die Ausgabe ein Verzeichnis oder eine einzelne Datei ist.

Standardwert: None
overwrite

Gibt für den Modus „upload“ an, ob vorhandene Daten überschrieben werden.

Standardwert: None
data_type
str

Optional. Der Datentyp kann verwendet werden, um den erwarteten Typ der Ausgabe festzulegen und zu beschreiben, wie die Daten von Verarbeitungsschritten verwendet werden sollen. Kann eine beliebige benutzerdefinierte Zeichenfolge sein.

Standardwert: None
pipeline_output_name
str

Ist dies angegeben, wird diese Ausgabe mithilfe von PipelineRun.get_pipeline_output() verfügbar sein. Pipelineausgabenamen müssen in der Pipeline eindeutig sein.

Standardwert: None
training_output

Definiert die Ausgabe für das Trainingsergebnis. Dieser Parameter ist nur für bestimmte Trainings erforderlich, die zu verschiedenen Arten von Ausgaben führen, etwa „Metrik“ und „Modell“. AutoMLStep ergibt beispielsweise Metriken und das Modell. Sie können auch bestimmte Trainingsiterationen oder Metriken definieren, mit denen Sie das beste Modell erhalten. Für HyperDriveStep können Sie auch die spezifischen Modelldateien definieren, die in der Ausgabe enthalten sein sollen.

Standardwert: None
dataset_registration

Optional. Dies ist ein interner Parameter. Sie sollten stattdessen PipelineData.as_dataset verwenden.

Standardwert: None
dataset_output

Optional. Dies ist ein interner Parameter. Sie sollten stattdessen OutputFileDatasetConfig verwenden.

Standardwert: None
name
Erforderlich
str

Der Name des OutputPortBinding-Objekts, der nur Buchstaben, Ziffern und Unterstriche enthalten darf.

datastore
Erforderlich

Der Datenspeicher, in dem sich die PipelineData befinden werden.

output_name
Erforderlich
str

Der Name der Ausgabe, wenn der Name „None“ ist. Kann nur Buchstaben, Ziffern und Unterstriche enthalten.

bind_mode
Erforderlich
str

Gibt an, ob der Erstellungsschritt die Methode „upload“ oder „mount“ oder „hdfs“ verwendet, um auf die Daten zuzugreifen.

path_on_compute
Erforderlich
str

Für den „upload“-Modus: der Pfad, in den das Modul die Ausgabe schreibt.

is_directory
Erforderlich

, wenn die Ausgabe ein Verzeichnis ist

overwrite
Erforderlich

Gibt für den Modus „upload“ an, ob vorhandene Daten überschrieben werden.

data_type
Erforderlich
str

Optional. Der Datentyp kann verwendet werden, um den erwarteten Typ der Ausgabe festzulegen und zu beschreiben, wie die Daten von Verarbeitungsschritten verwendet werden sollen. Kann eine beliebige benutzerdefinierte Zeichenfolge sein.

pipeline_output_name
Erforderlich
str

Ist dies angegeben, wird diese Ausgabe mithilfe von PipelineRun.get_pipeline_output() verfügbar sein. Pipelineausgabenamen müssen in der Pipeline eindeutig sein.

training_output
Erforderlich

Definiert die Ausgabe für das Trainingsergebnis. Dieser Parameter ist nur für bestimmte Trainings erforderlich, die zu verschiedenen Arten von Ausgaben führen, etwa „Metrik“ und „Modell“. AutoMLStep ergibt beispielsweise Metriken und das Modell. Sie können auch bestimmte Trainingsiterationen oder Metriken definieren, mit denen Sie das beste Modell erhalten. Für HyperDriveStep können Sie auch die spezifischen Modelldateien definieren, die in der Ausgabe enthalten sein sollen.

dataset_registration
Erforderlich

Optional. Dies ist ein interner Parameter. Sie sollten stattdessen PipelineData.as_dataset verwenden.

dataset_output
Erforderlich

Optional. Dies ist ein interner Parameter. Sie sollten stattdessen OutputFileDatasetConfig verwenden.

Hinweise

OutputPortBinding kann auf ähnliche Weise wie PipelineData beim Erstellen einer Pipeline verwendet werden, um Schritteingaben und -ausgaben festzulegen. Der Unterschied ist, dass OutputPortBinding mit InputPortBinding verwendet werden muss, um als Eingabe für einen anderen Schritt verwendet zu werden.

Ein Beispiel zum Erstellen einer Pipeline mit OutputPortBinding lautet wie folgt:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Dadurch wird eine Pipeline mit zwei Schritten erstellt. Der Prozessschritt wird zuerst ausgeführt, danach wird der Trainieren-Schritt ausgeführt. Azure Machine Learning stellt die vom Prozessschritt erzeugte Ausgabe, wie vom OutputPortBinding-Objekt beschrieben, für den Trainieren-Schritt zur Verfügung.

Attribute

bind_mode

Rufen Sie den Modus („upload“ oder „mount“ oder „hdfs“) ab, den der Erstellungsschritt zum Erstellen der Daten verwendet.

Gibt zurück

Typ Beschreibung
str

Der Bindungsmodus.

data_type

Rufen Sie den Typ der zu erstellenden Daten ab.

Gibt zurück

Typ Beschreibung
str

Der Name des Datentyps.

dataset_registration

Rufen Sie die Dataset-Registrierungsinformationen ab.

Gibt zurück

Typ Beschreibung

Die Dataset-Registrierungsinformationen.

datastore

Der Datenspeicher, in dem sich die PipelineData befinden werden.

Gibt zurück

Typ Beschreibung

Das Datenspeicherobjekt.

is_directory

Gibt an, ob die Ausgabe ein Verzeichnis ist.

Gibt zurück

Typ Beschreibung

is_directory

name

Name des OutputPortBinding-Objekts.

Gibt zurück

Typ Beschreibung
str

Der Name.

overwrite

Geben Sie für den Modus „Upload“ an, ob vorhandene Daten überschrieben werden sollen.

Gibt zurück

Typ Beschreibung

_overwrite

path_on_compute

Für den „upload“-Modus: der Pfad, in den das Modul die Ausgabe schreibt.

Gibt zurück

Typ Beschreibung
str

path_on_compute

pipeline_output_name

Rufen Sie den Namen der Pipelineausgabe ab, die diesem OutputPortBinding entspricht.

Gibt zurück

Typ Beschreibung
str

Der Name der Pipelineausgabe.

training_output

Rufen Sie die Trainingsausgabe ab.

Gibt zurück

Typ Beschreibung

Trainingsausgabe