OutputPortBinding Classe

Riferimento

Definisce un output denominato di un passaggio della pipeline.

OutputPortBinding può essere usato per specificare il tipo di dati che verranno prodotti da un passaggio e la modalità di produzione dei dati. Può essere usato con InputPortBinding per specificare che l'output del passaggio è un input obbligatorio di un altro passaggio.

Inizializzare OutputPortBinding.

Ereditarietà: builtins.object

OutputPortBinding

Costruttore

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Parametri

Nome	Descrizione
name Necessario	str Nome dell'oggetto OutputPortBinding, che può contenere solo lettere, cifre e caratteri di sottolineatura.
datastore	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] L'archivio dati in cui risiederà PipelineData. Valore predefinito: None
output_name	str Nome dell'output, se viene usato Nessun nome. Può contenere solo lettere, cifre e caratteri di sottolineatura. Valore predefinito: None
bind_mode	str Specifica se il passaggio di produzione userà il metodo "upload" o "mount" o "hdfs" per accedere ai dati. Valore predefinito: mount
path_on_compute	str Per la modalità di caricamento, il percorso in cui il modulo scrive l'output. Valore predefinito: None
is_directory	bool Indica se l'output è una directory o un singolo file. Valore predefinito: None
overwrite	bool Per la modalità di caricamento, se sovrascrivere i dati esistenti. Valore predefinito: None
data_type	str Facoltativa. Il tipo di dati può essere usato per specificare il tipo previsto dell'output e per illustrare in dettaglio l'utilizzo dei passaggi da eseguire. Può essere qualsiasi stringa definita dall'utente. Valore predefinito: None
pipeline_output_name	str Se specificato, questo output sarà disponibile usando PipelineRun.get_pipeline_output(). I nomi di output della pipeline devono essere univoci nella pipeline. Valore predefinito: None
training_output	TrainingOutput Definisce l'output per il risultato del training. Questa operazione è necessaria solo per training specifici che generano diversi tipi di output, ad esempio metriche e modello. Ad esempio, AutoMLStep restituisce metriche e modelli. È anche possibile definire specifiche iterazioni di training o metriche usate per ottenere un modello ottimale. Per HyperDriveStep, è anche possibile definire i file di modello specifici da includere nell'output. Valore predefinito: None
dataset_registration	DatasetRegistration Facoltativa. Si tratta di un parametro interno. È consigliabile usare invece PipelineData.as_dataset. Valore predefinito: None
dataset_output	OutputDatasetConfig Facoltativa. Si tratta di un parametro interno. È consigliabile usare OutputFileDatasetConfig intead. Valore predefinito: None
name Necessario	str Nome dell'oggetto OutputPortBinding, che può contenere solo lettere, cifre e caratteri di sottolineatura.
datastore Necessario	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] L'archivio dati in cui risiederà PipelineData.
output_name Necessario	str Nome dell'output, se viene usato Nessun nome. Può contenere solo lettere, cifre e caratteri di sottolineatura.
bind_mode Necessario	str Specifica se il passaggio di produzione userà il metodo "upload" o "mount" o "hdfs" per accedere ai dati.
path_on_compute Necessario	str Per la modalità di caricamento, il percorso in cui il modulo scrive l'output.
is_directory Necessario	bool se l'output è una directory
overwrite Necessario	bool Per la modalità di caricamento, se sovrascrivere i dati esistenti.
data_type Necessario	str Facoltativa. Il tipo di dati può essere usato per specificare il tipo previsto dell'output e per illustrare in dettaglio l'utilizzo dei passaggi da eseguire. Può essere qualsiasi stringa definita dall'utente.
pipeline_output_name Necessario	str Se specificato, questo output sarà disponibile usando PipelineRun.get_pipeline_output(). I nomi di output della pipeline devono essere univoci nella pipeline.
training_output Necessario	TrainingOutput Definisce l'output per il risultato del training. Questa operazione è necessaria solo per training specifici che generano diversi tipi di output, ad esempio metriche e modello. Ad esempio, AutoMLStep restituisce metriche e modelli. È anche possibile definire specifiche iterazioni di training o metriche usate per ottenere un modello ottimale. Per HyperDriveStep, è anche possibile definire i file di modello specifici da includere nell'output.
dataset_registration Necessario	DatasetRegistration Facoltativa. Si tratta di un parametro interno. È consigliabile usare invece PipelineData.as_dataset.
dataset_output Necessario	OutputDatasetConfig Facoltativa. Si tratta di un parametro interno. È consigliabile usare OutputFileDatasetConfig intead.

Commenti

OutputPortBinding può essere usato in modo PipelineData analogo alla compilazione di una pipeline per specificare input e output dei passaggi. La differenza è outputPortBinding deve essere usata con InputPortBinding per poter essere utilizzata come input per un altro passaggio.

Un esempio per costruire una pipeline con OutputPortBinding è il seguente:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Verrà creata una pipeline con due passaggi. Il passaggio del processo verrà eseguito per primo, quindi dopo il completamento, verrà eseguito il passaggio di training. Azure ML fornirà l'output prodotto dal passaggio del processo, come descritto dall'oggetto OutputPortBinding, al passaggio di training.

Attributi

bind_mode

Ottenere la modalità ("upload" o "mount" o "hdfs") che verrà usata per creare i dati.

Restituisce

Tipo	Descrizione
str	Modalità di associazione.

data_type

Ottiene il tipo di dati che verranno prodotti.

Restituisce

Tipo	Descrizione
str	Nome del tipo di dati.

dataset_registration

Ottenere le informazioni di registrazione del set di dati.

Restituisce

Tipo	Descrizione
DatasetRegistration	Informazioni di registrazione del set di dati.

datastore

L'archivio dati in cui risiederà PipelineData.

Restituisce

Tipo	Descrizione
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]	Oggetto Datastore.

is_directory

Indica se l'output è una directory.

Restituisce

Tipo	Descrizione
bool	is_directory

name

Nome dell'oggetto OutputPortBinding.

Restituisce

Tipo	Descrizione
str	Nome.

overwrite

Per la modalità di caricamento, indicare se sovrascrivere i dati esistenti.

Restituisce

Tipo	Descrizione
bool	_Sovrascrivere

path_on_compute

Per la modalità di caricamento, il percorso in cui il modulo scrive l'output.

Restituisce

Tipo	Descrizione
str	path_on_compute

pipeline_output_name

Ottenere il nome dell'output della pipeline corrispondente a questo OutputPortBinding.

Restituisce

Tipo	Descrizione
str	Nome dell'output della pipeline.

training_output

Ottenere l'output del training.

Restituisce

Tipo	Descrizione
TrainingOutput	Output del training

Condividi tramite

OutputPortBinding Classe

Costruttore

Parametri

Commenti

Attributi

bind_mode

Restituisce

data_type

Restituisce

dataset_registration

Restituisce

datastore

Restituisce

is_directory

Restituisce

name

Restituisce

overwrite

Restituisce

path_on_compute

Restituisce

pipeline_output_name

Restituisce

training_output

Restituisce

Commenti e suggerimenti

Risorse aggiuntive