OutputPortBinding Klasse
Definiert eine benannte Ausgabe eines Pipelineschritts.
Mit OutputPortBinding können Sie den Datentyp angeben, der von einem Schritt generiert wird, und festlegen, wie die Daten generiert werden. Sie kann mit InputPortBinding verwendet werden, um anzugeben, dass die Schrittausgabe eine erforderliche Eingabe eines anderen Schritts ist.
Initialisieren Sie OutputPortBinding.
- Vererbung
-
builtins.objectOutputPortBinding
Konstruktor
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parameter
Name | Beschreibung |
---|---|
name
Erforderlich
|
Der Name des OutputPortBinding-Objekts, der nur Buchstaben, Ziffern und Unterstriche enthalten darf. |
datastore
|
Der Datenspeicher, in dem sich die PipelineData befinden werden. Standardwert: None
|
output_name
|
Der Name der Ausgabe, wenn der Name „None“ ist. Darf nur Buchstaben, Ziffern und Unterstriche enthalten. Standardwert: None
|
bind_mode
|
Gibt an, ob der Erstellungsschritt die Methode „upload“ oder „mount“ oder „hdfs“ verwendet, um auf die Daten zuzugreifen. Standardwert: mount
|
path_on_compute
|
Für den „upload“-Modus: der Pfad, in den das Modul die Ausgabe schreibt. Standardwert: None
|
is_directory
|
Gibt an, ob die Ausgabe ein Verzeichnis oder eine einzelne Datei ist. Standardwert: None
|
overwrite
|
Gibt für den Modus „upload“ an, ob vorhandene Daten überschrieben werden. Standardwert: None
|
data_type
|
Optional. Der Datentyp kann verwendet werden, um den erwarteten Typ der Ausgabe festzulegen und zu beschreiben, wie die Daten von Verarbeitungsschritten verwendet werden sollen. Kann eine beliebige benutzerdefinierte Zeichenfolge sein. Standardwert: None
|
pipeline_output_name
|
Ist dies angegeben, wird diese Ausgabe mithilfe von PipelineRun.get_pipeline_output() verfügbar sein. Pipelineausgabenamen müssen in der Pipeline eindeutig sein. Standardwert: None
|
training_output
|
Definiert die Ausgabe für das Trainingsergebnis. Dieser Parameter ist nur für bestimmte Trainings erforderlich, die zu verschiedenen Arten von Ausgaben führen, etwa „Metrik“ und „Modell“. AutoMLStep ergibt beispielsweise Metriken und das Modell. Sie können auch bestimmte Trainingsiterationen oder Metriken definieren, mit denen Sie das beste Modell erhalten. Für HyperDriveStep können Sie auch die spezifischen Modelldateien definieren, die in der Ausgabe enthalten sein sollen. Standardwert: None
|
dataset_registration
|
Optional. Dies ist ein interner Parameter. Sie sollten stattdessen PipelineData.as_dataset verwenden. Standardwert: None
|
dataset_output
|
Optional. Dies ist ein interner Parameter. Sie sollten stattdessen OutputFileDatasetConfig verwenden. Standardwert: None
|
name
Erforderlich
|
Der Name des OutputPortBinding-Objekts, der nur Buchstaben, Ziffern und Unterstriche enthalten darf. |
datastore
Erforderlich
|
Der Datenspeicher, in dem sich die PipelineData befinden werden. |
output_name
Erforderlich
|
Der Name der Ausgabe, wenn der Name „None“ ist. Kann nur Buchstaben, Ziffern und Unterstriche enthalten. |
bind_mode
Erforderlich
|
Gibt an, ob der Erstellungsschritt die Methode „upload“ oder „mount“ oder „hdfs“ verwendet, um auf die Daten zuzugreifen. |
path_on_compute
Erforderlich
|
Für den „upload“-Modus: der Pfad, in den das Modul die Ausgabe schreibt. |
is_directory
Erforderlich
|
, wenn die Ausgabe ein Verzeichnis ist |
overwrite
Erforderlich
|
Gibt für den Modus „upload“ an, ob vorhandene Daten überschrieben werden. |
data_type
Erforderlich
|
Optional. Der Datentyp kann verwendet werden, um den erwarteten Typ der Ausgabe festzulegen und zu beschreiben, wie die Daten von Verarbeitungsschritten verwendet werden sollen. Kann eine beliebige benutzerdefinierte Zeichenfolge sein. |
pipeline_output_name
Erforderlich
|
Ist dies angegeben, wird diese Ausgabe mithilfe von PipelineRun.get_pipeline_output() verfügbar sein. Pipelineausgabenamen müssen in der Pipeline eindeutig sein. |
training_output
Erforderlich
|
Definiert die Ausgabe für das Trainingsergebnis. Dieser Parameter ist nur für bestimmte Trainings erforderlich, die zu verschiedenen Arten von Ausgaben führen, etwa „Metrik“ und „Modell“. AutoMLStep ergibt beispielsweise Metriken und das Modell. Sie können auch bestimmte Trainingsiterationen oder Metriken definieren, mit denen Sie das beste Modell erhalten. Für HyperDriveStep können Sie auch die spezifischen Modelldateien definieren, die in der Ausgabe enthalten sein sollen. |
dataset_registration
Erforderlich
|
Optional. Dies ist ein interner Parameter. Sie sollten stattdessen PipelineData.as_dataset verwenden. |
dataset_output
Erforderlich
|
Optional. Dies ist ein interner Parameter. Sie sollten stattdessen OutputFileDatasetConfig verwenden. |
Hinweise
OutputPortBinding kann auf ähnliche Weise wie PipelineData beim Erstellen einer Pipeline verwendet werden, um Schritteingaben und -ausgaben festzulegen. Der Unterschied ist, dass OutputPortBinding mit InputPortBinding verwendet werden muss, um als Eingabe für einen anderen Schritt verwendet zu werden.
Ein Beispiel zum Erstellen einer Pipeline mit OutputPortBinding lautet wie folgt:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Dadurch wird eine Pipeline mit zwei Schritten erstellt. Der Prozessschritt wird zuerst ausgeführt, danach wird der Trainieren-Schritt ausgeführt. Azure Machine Learning stellt die vom Prozessschritt erzeugte Ausgabe, wie vom OutputPortBinding-Objekt beschrieben, für den Trainieren-Schritt zur Verfügung.
Attribute
bind_mode
Rufen Sie den Modus („upload“ oder „mount“ oder „hdfs“) ab, den der Erstellungsschritt zum Erstellen der Daten verwendet.
Gibt zurück
Typ | Beschreibung |
---|---|
Der Bindungsmodus. |
data_type
Rufen Sie den Typ der zu erstellenden Daten ab.
Gibt zurück
Typ | Beschreibung |
---|---|
Der Name des Datentyps. |
dataset_registration
Rufen Sie die Dataset-Registrierungsinformationen ab.
Gibt zurück
Typ | Beschreibung |
---|---|
Die Dataset-Registrierungsinformationen. |
datastore
Der Datenspeicher, in dem sich die PipelineData befinden werden.
Gibt zurück
Typ | Beschreibung |
---|---|
Das Datenspeicherobjekt. |
is_directory
name
overwrite
Geben Sie für den Modus „Upload“ an, ob vorhandene Daten überschrieben werden sollen.
Gibt zurück
Typ | Beschreibung |
---|---|
_overwrite |
path_on_compute
Für den „upload“-Modus: der Pfad, in den das Modul die Ausgabe schreibt.
Gibt zurück
Typ | Beschreibung |
---|---|
path_on_compute |
pipeline_output_name
Rufen Sie den Namen der Pipelineausgabe ab, die diesem OutputPortBinding entspricht.
Gibt zurück
Typ | Beschreibung |
---|---|
Der Name der Pipelineausgabe. |