OutputPortBinding Classe
Definisce un output denominato di un passaggio della pipeline.
OutputPortBinding può essere usato per specificare il tipo di dati che verranno prodotti da un passaggio e la modalità di produzione dei dati. Può essere usato con InputPortBinding per specificare che l'output del passaggio è un input obbligatorio di un altro passaggio.
Inizializzare OutputPortBinding.
- Ereditarietà
-
builtins.objectOutputPortBinding
Costruttore
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parametri
Nome | Descrizione |
---|---|
name
Necessario
|
Nome dell'oggetto OutputPortBinding, che può contenere solo lettere, cifre e caratteri di sottolineatura. |
datastore
|
L'archivio dati in cui risiederà PipelineData. Valore predefinito: None
|
output_name
|
Nome dell'output, se viene usato Nessun nome. Può contenere solo lettere, cifre e caratteri di sottolineatura. Valore predefinito: None
|
bind_mode
|
Specifica se il passaggio di produzione userà il metodo "upload" o "mount" o "hdfs" per accedere ai dati. Valore predefinito: mount
|
path_on_compute
|
Per la modalità di caricamento, il percorso in cui il modulo scrive l'output. Valore predefinito: None
|
is_directory
|
Indica se l'output è una directory o un singolo file. Valore predefinito: None
|
overwrite
|
Per la modalità di caricamento, se sovrascrivere i dati esistenti. Valore predefinito: None
|
data_type
|
Facoltativa. Il tipo di dati può essere usato per specificare il tipo previsto dell'output e per illustrare in dettaglio l'utilizzo dei passaggi da eseguire. Può essere qualsiasi stringa definita dall'utente. Valore predefinito: None
|
pipeline_output_name
|
Se specificato, questo output sarà disponibile usando PipelineRun.get_pipeline_output(). I nomi di output della pipeline devono essere univoci nella pipeline. Valore predefinito: None
|
training_output
|
Definisce l'output per il risultato del training. Questa operazione è necessaria solo per training specifici che generano diversi tipi di output, ad esempio metriche e modello. Ad esempio, AutoMLStep restituisce metriche e modelli. È anche possibile definire specifiche iterazioni di training o metriche usate per ottenere un modello ottimale. Per HyperDriveStep, è anche possibile definire i file di modello specifici da includere nell'output. Valore predefinito: None
|
dataset_registration
|
Facoltativa. Si tratta di un parametro interno. È consigliabile usare invece PipelineData.as_dataset. Valore predefinito: None
|
dataset_output
|
Facoltativa. Si tratta di un parametro interno. È consigliabile usare OutputFileDatasetConfig intead. Valore predefinito: None
|
name
Necessario
|
Nome dell'oggetto OutputPortBinding, che può contenere solo lettere, cifre e caratteri di sottolineatura. |
datastore
Necessario
|
L'archivio dati in cui risiederà PipelineData. |
output_name
Necessario
|
Nome dell'output, se viene usato Nessun nome. Può contenere solo lettere, cifre e caratteri di sottolineatura. |
bind_mode
Necessario
|
Specifica se il passaggio di produzione userà il metodo "upload" o "mount" o "hdfs" per accedere ai dati. |
path_on_compute
Necessario
|
Per la modalità di caricamento, il percorso in cui il modulo scrive l'output. |
is_directory
Necessario
|
se l'output è una directory |
overwrite
Necessario
|
Per la modalità di caricamento, se sovrascrivere i dati esistenti. |
data_type
Necessario
|
Facoltativa. Il tipo di dati può essere usato per specificare il tipo previsto dell'output e per illustrare in dettaglio l'utilizzo dei passaggi da eseguire. Può essere qualsiasi stringa definita dall'utente. |
pipeline_output_name
Necessario
|
Se specificato, questo output sarà disponibile usando PipelineRun.get_pipeline_output(). I nomi di output della pipeline devono essere univoci nella pipeline. |
training_output
Necessario
|
Definisce l'output per il risultato del training. Questa operazione è necessaria solo per training specifici che generano diversi tipi di output, ad esempio metriche e modello. Ad esempio, AutoMLStep restituisce metriche e modelli. È anche possibile definire specifiche iterazioni di training o metriche usate per ottenere un modello ottimale. Per HyperDriveStep, è anche possibile definire i file di modello specifici da includere nell'output. |
dataset_registration
Necessario
|
Facoltativa. Si tratta di un parametro interno. È consigliabile usare invece PipelineData.as_dataset. |
dataset_output
Necessario
|
Facoltativa. Si tratta di un parametro interno. È consigliabile usare OutputFileDatasetConfig intead. |
Commenti
OutputPortBinding può essere usato in modo PipelineData analogo alla compilazione di una pipeline per specificare input e output dei passaggi. La differenza è outputPortBinding deve essere usata con InputPortBinding per poter essere utilizzata come input per un altro passaggio.
Un esempio per costruire una pipeline con OutputPortBinding è il seguente:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Verrà creata una pipeline con due passaggi. Il passaggio del processo verrà eseguito per primo, quindi dopo il completamento, verrà eseguito il passaggio di training. Azure ML fornirà l'output prodotto dal passaggio del processo, come descritto dall'oggetto OutputPortBinding, al passaggio di training.
Attributi
bind_mode
Ottenere la modalità ("upload" o "mount" o "hdfs") che verrà usata per creare i dati.
Restituisce
Tipo | Descrizione |
---|---|
Modalità di associazione. |
data_type
Ottiene il tipo di dati che verranno prodotti.
Restituisce
Tipo | Descrizione |
---|---|
Nome del tipo di dati. |
dataset_registration
Ottenere le informazioni di registrazione del set di dati.
Restituisce
Tipo | Descrizione |
---|---|
Informazioni di registrazione del set di dati. |
datastore
L'archivio dati in cui risiederà PipelineData.
Restituisce
Tipo | Descrizione |
---|---|
Oggetto Datastore. |
is_directory
name
overwrite
Per la modalità di caricamento, indicare se sovrascrivere i dati esistenti.
Restituisce
Tipo | Descrizione |
---|---|
_Sovrascrivere |
path_on_compute
Per la modalità di caricamento, il percorso in cui il modulo scrive l'output.
Restituisce
Tipo | Descrizione |
---|---|
path_on_compute |
pipeline_output_name
Ottenere il nome dell'output della pipeline corrispondente a questo OutputPortBinding.
Restituisce
Tipo | Descrizione |
---|---|
Nome dell'output della pipeline. |