Compartir a través de


steps Paquete

Contiene pasos creados previamente que se pueden ejecutar en una canalización de Azure Machine Learning.

Los pasos de Azure ML Pipeline se pueden configurar conjuntamente para construir una canalización, que representa un flujo de trabajo Azure Machine Learning compartido y reutilizable. Cada paso de una canalización se puede configurar para permitir la reutilización de los resultados de ejecución anteriores si el contenido del paso (scripts y dependencias), así como las entradas y los parámetros permanecen sin cambios.

Las clases de este paquete se usan normalmente junto con las clases del paquete core. El paquete principal contiene clases para configurar datos (PipelineData), programar (Schedule) y administrar la salida de los pasos (StepRun).

Los pasos creados previamente en este paquete abarcan muchos escenarios comunes que se encuentran en los flujos de trabajo de aprendizaje automático. Para empezar a trabajar con los pasos de canalización creados previamente, consulte:

Módulos

adla_step

Contiene la funcionalidad para crear un paso de canalización de Azure ML para ejecutar un script de U-SQL con Azure Data Lake Analytics.

automl_step

Contiene funcionalidad para agregar y administrar un paso de canalización de aprendizaje automático automatizado en Azure Machine Learning.

azurebatch_step

Contiene funcionalidad para crear un paso de canalización de Azure Machine Learning que ejecuta un archivo ejecutable de Windows en Azure Batch.

command_step

Contiene funcionalidad para crear un paso de Azure ML Pipeline que ejecuta comandos.

data_transfer_step

Contiene funcionalidad para crear un paso de canalización de Azure ML que transfiere datos entre opciones de almacenamiento.

databricks_step

Contiene funcionalidad para crear un paso de canalización de Azure Machine Learning para ejecutar un cuaderno de Databricks o un script de Python en DBFS.

estimator_step

Contiene funcionalidad para crear un paso de canalización que ejecuta un estimador para el entrenamiento del modelo de Machine Learning.

hyper_drive_step

Contiene funcionalidad para crear y administrar pasos de Azure ML Pipeline que ejecutan el ajuste de hiperparámetros.

kusto_step

Contiene funcionalidad para crear un paso de canalización de Azure Machine Learning que ejecuta un cuaderno de Kusto.

module_step

Contiene funcionalidad para agregar un paso de canalización de Azure Machine Learning mediante una versión existente de un módulo.

mpi_step

Contiene funcionalidad para agregar un paso de canalización de Azure ML para ejecutar un trabajo de MPI para el aprendizaje de modelos de Machine Learning.

parallel_run_config

Contiene la funcionalidad para configurar una clase ParallelRunStep.

parallel_run_step

Contiene funcionalidad para agregar un paso para ejecutar el script de usuario en modo paralelo en varios destinos de AmlCompute.

python_script_step

Contiene funcionalidad para crear un paso de Azure ML Pipeline que ejecuta un script de Python.

r_script_step

Contiene funcionalidad para crear un paso de canalización de Azure Machine Learning que ejecuta el script de R.

synapse_spark_step

Contiene funcionalidad para crear un paso de Azure ML Synapse que ejecuta un script de Python.

Clases

AdlaStep

Crea un paso de Azure ML Pipeline para ejecutar un script U-SQL con Azure Data Lake Analytics.

Para obtener un ejemplo del uso de este AdlaStep, consulte el cuaderno https://aka.ms/pl-adla.

Cree un paso de canalización de Azure ML para ejecutar un script U-SQL con Azure Data Lake Analytics.

AutoMLStep

Crea un paso de canalización de Azure Machine Learning que encapsula una ejecución de aprendizaje automático automatizado.

Para obtener un ejemplo del uso de AutoMLStep, consulte el cuaderno https://aka.ms/pl-automl.

Inicialice un autoMLStep.

AutoMLStepRun

Proporciona información sobre una ejecución de experimento de ML automatizado y sobre los métodos para recuperar salidas predeterminadas.

La clase AutoMLStepRun se usa para administrar, comprobar el estado y recuperar los detalles de la ejecución una vez que se envía una ejecución de ML automatizado en una canalización. Además, esta clase se puede usar para obtener las salidas predeterminadas de AutoMLStep mediante la clase StepRun.

Inicialice una ejecución de paso de automl.

AzureBatchStep

Crea un paso de canalización de Azure Machine Learning para enviar trabajos a Azure Batch.

Nota: Este paso no admite la carga o descarga de directorios ni de su contenido.

Para obtener un ejemplo del uso de AzureBatchStep, consulte el cuaderno https://aka.ms/pl-azbatch.

Cree un paso de canalización de Azure ML para enviar trabajos a Azure Batch.

CommandStep

Cree un paso de Azure ML Pipeline que ejecute un comando.

Cree un paso de Azure ML Pipeline que ejecute un comando.

DataTransferStep

Crea un paso de canalización de Azure ML que transfiere datos entre las opciones de almacenamiento.

DataTransferStep admite tipos de almacenamiento comunes (por ejemplo, Azure Blob Storage y Azure Data Lake) como orígenes y receptores. Para más información, vea la sección Notas.

Para un ejemplo del uso de DataTransferStep, consulte el cuaderno https://aka.ms/pl-data-trans.

Cree un paso de canalización de Azure ML que transfiera datos entre las opciones de almacenamiento.

DatabricksStep

Crea un paso de canalización de Azure Machine Learning para agregar un cuaderno de DataBricks, un script de Python o un archivo JAR como nodo.

Para obtener un ejemplo del uso de DatabricksStep, consulte el cuaderno https://aka.ms/pl-databricks.

Cree un paso de canalización de Azure ML para agregar un cuaderno de DataBricks, un script de Python o un archivo JAR como nodo.

Para obtener un ejemplo del uso de DatabricksStep, consulte el cuaderno https://aka.ms/pl-databricks.

:p aram python_script_name:[Obligatorio] Nombre de un script de Python relativo a source_directory. Si el script toma entradas y salidas, se pasarán al script como parámetros. Si se especifica python_script_name, también se debe especificar source_directory.

Especifique exactamente uno entre notebook_path, python_script_path, python_script_name o main_class_name.

Si especifica un objeto DataReference como entrada con data_reference_name=input1 y un objeto PipelineData como salida con name=output1, las entradas y salidas se pasarán al script como parámetros. Este será su aspecto y tendrá que analizar los argumentos del script para acceder a las rutas de acceso de cada entrada y salida: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Además, los parámetros siguientes estarán disponibles en el script:

  • AZUREML_RUN_TOKEN: token de AML para autenticarse con Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: hora de expiración del token de AML.
  • AZUREML_RUN_ID: identificador de ejecución de Azure Machine Learning para esta ejecución.
  • AZUREML_ARM_SUBSCRIPTION: suscripción de Azure del área de trabajo de AML.
  • AZUREML_ARM_RESOURCEGROUP: grupo de recursos de Azure del área de trabajo de Azure Machine Learning.
  • AZUREML_ARM_WORKSPACE_NAME: nombre del área de trabajo de Azure Machine Learning.
  • AZUREML_ARM_PROJECT_NAME: nombre del experimento de Azure Machine Learning.
  • AZUREML_SERVICE_ENDPOINT: dirección URL del punto de conexión de los servicios de AML.
  • AZUREML_WORKSPACE_ID: id. del área de trabajo de Azure Machine Learning.
  • AZUREML_EXPERIMENT_ID: id. del experimento de Azure Machine Learning.
  • AZUREML_SCRIPT_DIRECTORY_NAME: ruta de acceso de directorios en DBFS donde se ha copiado source_directory.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

Al ejecutar un script de Python desde la máquina local en Databricks con los parámetros source_directory y python_script_name de Databricks, se copia source_directory en DBFS y la ruta de acceso de directorios en DBFS se pasa como un parámetro al script cuando comienza la ejecución. Este parámetro se etiqueta como --AZUREML_SCRIPT_DIRECTORY_NAME. Debe agregar un prefijo con la cadena "dbfs:/". o "/dbfs/" para acceder al directorio en DBFS.

EstimatorStep

EN DESUSO. Crea un paso de canalización que ejecutará Estimator para el entrenamiento del modelo de Azure Machine Learning.

Cree un paso de canalización de Azure ML para ejecutar estimador para el entrenamiento del modelo de Machine Learning.

EN DESUSO. Use CommandStep en su lugar. Para obtener un ejemplo, vea Cómo ejecutar el entrenamiento de ML en canalizaciones con CommandStep.

HyperDriveStep

Crea un paso de Azure ML Pipeline para ejecutar el ajuste de hiperparámetros para modelos de Machine Learning.

Para obtener un ejemplo del uso de HyperDriveStep, vea el cuaderno https://aka.ms/pl-hyperdrive.

Cree un paso de canalización de Azure ML para ejecutar la asignación de hiperparámetros para el entrenamiento del modelo de Machine Learning.

HyperDriveStepRun

Administre, compruebe el estado y recupere los detalles de ejecución de un paso de canalización HyperDriveStep.

HyperDriveStepRun proporciona la funcionalidad de HyperDriveRun con la compatibilidad adicional de StepRun. La clase HyperDriveStepRun permite administrar, comprobar el estado y recuperar los detalles de ejecución de la ejecución de HyperDrive y cada una de sus ejecuciones secundarias generadas. La clase StepRun permite hacerlo una vez que se envía la ejecución de canalización primaria y la canalización ha enviado la ejecución del paso.

Inicialice un hyperDriveStepRun.

HyperDriveStepRun proporciona la funcionalidad de HyperDriveRun con la compatibilidad adicional de StepRun. La clase HyperDriveRun permite administrar, comprobar el estado y recuperar los detalles de ejecución de la ejecución de HyperDrive y cada una de sus ejecuciones secundarias generadas. La clase StepRun permite hacerlo una vez que se envía la ejecución de canalización primaria y la canalización ha enviado la ejecución del paso.

KustoStep

KustoStep habilita la funcionalidad para ejecutar consultas de Kusto en un clúster de Kusto de destino en canalizaciones de Azure Machine Learning.

Inicialice KustoStep.

ModuleStep

Crea un paso de canalización de Azure Machine Learning para ejecutar una versión específica de un módulo.

Los objetos Module definen cálculos reutilizables, como scripts o ejecutables, que se pueden usar en diferentes escenarios de aprendizaje automático y por usuarios diferentes. Para usar una versión específica de un módulo en una canalización, cree un paso ModuleStep. ModuleStep es un paso en la canalización que usa una clase ModuleVersion existente.

Para obtener un ejemplo del uso de ModuleStep, consulte el cuaderno https://aka.ms/pl-modulestep.

Cree un paso de canalización de Azure ML para ejecutar una versión específica de un módulo.

MpiStep

Crea un paso de canalización de Azure ML para ejecutar un trabajo de MPI.

Para obtener un ejemplo del uso de MpiStep, consulte el cuaderno https://aka.ms/pl-style-trans.

Cree un paso de canalización de Azure ML para ejecutar un trabajo de MPI.

EN DESUSO. Use CommandStep en su lugar. Para ver un ejemplo, consulte Ejecución del entrenamiento distribuido en canalizaciones con CommandStep.

ParallelRunConfig

Define la configuración de un objeto ParallelRunStep.

Para obtener un ejemplo del uso de ParallelRunStep, vea el cuaderno https://aka.ms/batch-inference-notebooks.

Para consultar la guía de solución de problemas, vea https://aka.ms/prstsg. Puede encontrar más referencias allí.

Inicialice el objeto config.

ParallelRunStep

Crea un paso de canalización de Azure Machine Learning para procesar grandes cantidades de datos de forma asincrónica y en paralelo.

Para obtener un ejemplo del uso de ParallelRunStep, vea el cuaderno https://aka.ms/batch-inference-notebooks.

Para consultar la guía de solución de problemas, vea https://aka.ms/prstsg. Puede encontrar más referencias allí.

Cree un paso de canalización de Azure ML para procesar grandes cantidades de datos de forma asincrónica y en paralelo.

Para obtener un ejemplo de uso de ParallelRunStep, consulte el vínculo https://aka.ms/batch-inference-notebooksdel cuaderno .

PythonScriptStep

Crea un paso de canalización de Azure ML que ejecuta el script de Python.

Para un ejemplo del uso de PythonScriptStep, consulte el cuaderno https://aka.ms/pl-get-started.

Cree un paso de canalización de Azure ML que ejecute el script de Python.

RScriptStep

Nota

Se trata de una clase experimental y puede cambiar en cualquier momento. Consulte https://aka.ms/azuremlexperimental para más información.

Crea un paso de canalización de Azure Machine Learning que ejecuta el script de R.

Cree un paso de canalización de Azure ML que ejecute un script de R.

EN DESUSO. Use CommandStep en su lugar. Para obtener un ejemplo, vea Cómo ejecutar scripts de R en canalizaciones con CommandStep.

SynapseSparkStep

Nota

Se trata de una clase experimental y puede cambiar en cualquier momento. Consulte https://aka.ms/azuremlexperimental para más información.

Crea un paso de Azure ML Synapse que envía y ejecuta el script de Python.

Cree un paso de canalización de Azure ML que ejecute el trabajo de Spark en el grupo de Spark de Synapse.