Sdílet prostřednictvím


steps Balíček

Obsahuje předdefinované kroky, které je možné provést v kanálu Azure Machine Learning.

Kroky kanálu Azure ML je možné nakonfigurovat společně a vytvořit kanál, který představuje pracovní postup služby Azure Machine Learning, který lze sdílet a opakovaně použít. Každý krok kanálu je možné nakonfigurovat tak, aby umožňoval opakované použití předchozích výsledků spuštění, pokud obsah kroku (skripty a závislosti) i vstupy a parametry zůstanou beze změny.

Třídy v tomto balíčku se obvykle používají společně s třídami v core balíčku. Základní balíček obsahuje třídy pro konfiguraci dat (PipelineData), plánování (Schedule) a správu výstupu kroků (StepRun).

Předdefinované kroky v tomto balíčku pokrývají řadu běžných scénářů, ke kterým dochází v pracovních postupech strojového učení. Pokud chcete začít s předem připravenými kroky kanálu, přečtěte si:

Moduly

adla_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML pro spuštění skriptu U-SQL s Azure Data Lake Analytics.

automl_step

Obsahuje funkce pro přidání a správu automatizovaného kroku kanálu ML ve službě Azure Machine Learning.

azurebatch_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML, který spouští spustitelný soubor Windows v Azure Batch.

command_step

Obsahuje funkci pro vytvoření kroku kanálu Azure ML, který spouští příkazy.

data_transfer_step

Obsahuje funkci pro vytvoření kroku kanálu Azure ML, který přenáší data mezi možnostmi úložiště.

databricks_step

Obsahuje funkce pro vytvoření kroku kanálu Azure ML pro spuštění poznámkového bloku Databricks nebo skriptu Pythonu na DBFS.

estimator_step

Obsahuje funkci pro vytvoření kroku kanálu, který spouští nástroj Estimator pro trénování modelu služby Machine Learning.

hyper_drive_step

Obsahuje funkce pro vytváření a správu kroků kanálu Azure ML, které spouští ladění hyperparametrů.

kusto_step

Obsahuje funkci pro vytvoření kroku kanálu Azure ML pro spuštění poznámkového bloku Kusto.

module_step

Obsahuje funkci pro přidání kroku kanálu Azure Machine Learning pomocí existující verze modulu.

mpi_step

Obsahuje funkci pro přidání kroku kanálu Azure ML ke spuštění úlohy MPI pro trénování modelu služby Machine Learning.

parallel_run_config

Obsahuje funkce pro konfiguraci objektu ParallelRunStep.

parallel_run_step

Obsahuje funkci pro přidání kroku pro spuštění uživatelského skriptu v paralelním režimu pro více cílů AmlCompute.

python_script_step

Obsahuje funkci pro vytvoření kroku kanálu Azure ML, který spouští skript Pythonu.

r_script_step

Obsahuje funkci pro vytvoření kroku kanálu Azure ML, který spouští skript jazyka R.

synapse_spark_step

Obsahuje funkci pro vytvoření kroku Synapse v Azure ML, který spouští skript Pythonu.

Třídy

AdlaStep

Vytvoří krok kanálu Azure ML pro spuštění skriptu U-SQL pomocí Azure Data Lake Analytics.

Příklad použití tohoto kroku AdlaStep najdete v poznámkovém bloku https://aka.ms/pl-adla.

Vytvořte krok kanálu Azure ML pro spuštění skriptu U-SQL pomocí Azure Data Lake Analytics.

AutoMLStep

Vytvoří krok kanálu Azure ML, který zapouzdřuje automatizované spuštění ml.

Příklad použití funkce AutoMLStep najdete v poznámkovém bloku https://aka.ms/pl-automl.

Inicializace kroku AutoMLStep.

AutoMLStepRun

Poskytuje informace o automatizovaném spuštění experimentu ML a metodách pro načtení výchozích výstupů.

Třída AutoMLStepRun se používá ke správě, kontrole stavu a načítání podrobností o spuštění po odeslání automatizovaného spuštění ML v kanálu. Kromě toho lze tuto třídu použít k získání výchozích AutoMLStep výstupů třídy prostřednictvím StepRun třídy.

Inicializujte spuštění kroku automl.

AzureBatchStep

Vytvoří krok kanálu Azure ML pro odesílání úloh do Azure Batch.

Poznámka: Tento krok nepodporuje nahrávání a stahování adresářů a jejich obsahu.

Příklad použití AzureBatchStep najdete v poznámkovém bloku https://aka.ms/pl-azbatch.

Vytvořte krok kanálu Azure ML pro odesílání úloh do Azure Batch.

CommandStep

Vytvořte krok kanálu Azure ML, který spustí příkaz.

Vytvořte krok kanálu Azure ML, který spustí příkaz.

DataTransferStep

Vytvoří krok kanálu Azure ML, který přenáší data mezi možnostmi úložiště.

DataTransferStep podporuje běžné typy úložišť, jako jsou Azure Blob Storage a Azure Data Lake jako zdroje a jímky. Další informace najdete v části Poznámky .

Příklad použití DataTransferStep najdete v poznámkovém bloku https://aka.ms/pl-data-trans.

Vytvořte krok kanálu Azure ML, který přenáší data mezi možnostmi úložiště.

DatabricksStep

Vytvoří krok kanálu Azure ML pro přidání poznámkového bloku DataBricks, skriptu Pythonu nebo jar jako uzlu.

Příklad použití DatabricksStep najdete v poznámkovém bloku https://aka.ms/pl-databricks.

Vytvořte krok kanálu Azure ML, který přidá poznámkový blok DataBricks, skript Pythonu nebo JAR jako uzel.

Příklad použití DatabricksStep najdete v poznámkovém bloku https://aka.ms/pl-databricks.

:p aram python_script_name:[Povinné] Název skriptu Pythonu vzhledem k source_directory. Pokud skript přijímá vstupy a výstupy, předají se skriptu jako parametry. Pokud python_script_name je zadaný source_directory , musí být také.

Zadejte přesně jednu z hodnot notebook_path, python_script_path, python_script_namenebo main_class_name.

Pokud jako vstup zadáte objekt DataReference s data_reference_name=input1 a objekt PipelineData jako výstup s name=output1, pak se vstupy a výstupy předají skriptu jako parametry. Takto budou vypadat a budete muset parsovat argumenty ve skriptu, abyste získali přístup k cestám každého vstupu a výstupu: "-input1","wasbs://test@storagename.blob.core.windows.net/test","-output1", "wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

Kromě toho budou ve skriptu k dispozici následující parametry:

  • AZUREML_RUN_TOKEN: Token AML pro ověřování ve službě Azure Machine Learning.
  • AZUREML_RUN_TOKEN_EXPIRY: Doba vypršení platnosti tokenu AML.
  • AZUREML_RUN_ID: ID spuštění služby Azure Machine Learning pro toto spuštění.
  • AZUREML_ARM_SUBSCRIPTION: Předplatné Azure pro váš pracovní prostor AML.
  • AZUREML_ARM_RESOURCEGROUP: Skupina prostředků Azure pro pracovní prostor Služby Azure Machine Learning.
  • AZUREML_ARM_WORKSPACE_NAME: Název pracovního prostoru služby Azure Machine Learning.
  • AZUREML_ARM_PROJECT_NAME: Název experimentu Azure Machine Learning.
  • AZUREML_SERVICE_ENDPOINT: Adresa URL koncového bodu pro služby AML.
  • AZUREML_WORKSPACE_ID: ID pracovního prostoru Služby Azure Machine Learning.
  • AZUREML_EXPERIMENT_ID: ID experimentu Azure Machine Learning.
  • AZUREML_SCRIPT_DIRECTORY_NAME: Cesta k adresáři v DBFS, kam se zkopírovala source_directory.
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

Když spouštíte skript Pythonu z místního počítače v Databricks pomocí parametrů source_directory DatabricksStep a python_script_name, zkopíruje se váš source_directory do DBFS a cesta k adresáři v DBFS se při spuštění předá jako parametr do skriptu. Tento parametr je označený jako –AZUREML_SCRIPT_DIRECTORY_NAME. Musíte před něj zadat předponu řetězcem dbfs:/. nebo /dbfs/ pro přístup k adresáři v DBFS.

EstimatorStep

ZASTARALÉ. Vytvoří krok kanálu, který se spustí Estimator pro trénování modelu Azure ML.

Vytvořte krok kanálu Azure ML, který spustí nástroj Estimator pro trénování modelu služby Machine Learning.

ZASTARALÉ. Místo toho CommandStep použijte. Příklad najdete v tématu Jak spustit trénování ML v kanálech pomocí CommandStep.

HyperDriveStep

Vytvoří krok kanálu Azure ML pro spuštění hyperparametrů pro trénování modelu služby Machine Learning.

Příklad použití HyperDriveStep najdete v poznámkovém bloku https://aka.ms/pl-hyperdrive.

Vytvořte krok kanálu Azure ML pro spuštění hyperparametrového zařazení pro trénování modelu služby Machine Learning.

HyperDriveStepRun

Správa, kontrola stavu a načtení podrobností o spuštění pro HyperDriveStep krok kanálu

HyperDriveStepRun poskytuje funkce nástroje HyperDriveRun s další podporou nástroje StepRun. Třída HyperDriveStepRun umožňuje spravovat, kontrolovat stav a načítat podrobnosti o spuštění hyperdrivu a každém z jeho vygenerovaných podřízených spuštění. Třída StepRun to umožňuje, jakmile je nadřazené spuštění kanálu odesláno a kanál odešle krok spuštění.

Inicializace HyperDriveStepRun.

HyperDriveStepRun poskytuje funkce nástroje HyperDriveRun s další podporou nástroje StepRun. Třída HyperDriveRun umožňuje spravovat, kontrolovat stav a načítat podrobnosti spuštění pro spuštění HyperDrive a každé jeho vygenerované podřízené spuštění. Třída StepRun to umožňuje, jakmile je nadřazené spuštění kanálu odesláno a kanál odešle krok spuštění.

KustoStep

KustoStep umožňuje spouštět dotazy Kusto v cílovém clusteru Kusto ve službě Azure ML Pipelines.

Inicializace KustoStep

ModuleStep

Vytvoří krok kanálu Azure Machine Learning pro spuštění konkrétní verze modulu.

Module Objekty definují opakovaně použitelné výpočty, jako jsou skripty nebo spustitelné soubory, které můžou být použity v různých scénářích strojového učení a různými uživateli. Pokud chcete použít konkrétní verzi modulu v kanálu, vytvořte ModulKrok. ModuleStep je krok v kanálu, který používá existující ModuleVersion.

Příklad použití ModuluStep najdete v poznámkovém bloku https://aka.ms/pl-modulestep.

Vytvořte krok kanálu Azure ML pro spuštění konkrétní verze modulu.

MpiStep

Vytvoří krok kanálu Azure ML pro spuštění úlohy MPI.

Příklad použití MpiStep najdete v poznámkovém bloku https://aka.ms/pl-style-trans.

Vytvořte krok kanálu Azure ML pro spuštění úlohy MPI.

ZASTARALÉ. Místo toho CommandStep použijte. Příklad najdete v tématu Spuštění distribuovaného trénování v kanálech pomocí CommandStep.

ParallelRunConfig

Definuje konfiguraci objektu ParallelRunStep .

Příklad použití ParallelRunStep najdete v poznámkovém bloku https://aka.ms/batch-inference-notebooks.

Průvodce odstraňováním potíží najdete v tématu https://aka.ms/prstsg. Další odkazy najdete tady.

Inicializuje objekt konfigurace.

ParallelRunStep

Vytvoří krok kanálu Azure Machine Learning, který asynchronně a paralelně zpracovává velké objemy dat.

Příklad použití ParallelRunStep najdete v poznámkovém bloku https://aka.ms/batch-inference-notebooks.

Průvodce odstraňováním potíží najdete v tématu https://aka.ms/prstsg. Další odkazy najdete tady.

Vytvořte krok kanálu Azure ML, který asynchronně a paralelně zpracovává velké objemy dat.

Příklad použití ParallelRunStep najdete v odkazu https://aka.ms/batch-inference-notebooksna poznámkový blok .

PythonScriptStep

Vytvoří krok kanálu Azure ML, který spouští skript Pythonu.

Příklad použití PythonScriptStep najdete v poznámkovém bloku https://aka.ms/pl-get-started.

Vytvořte krok kanálu Azure ML, který spouští skript Pythonu.

RScriptStep

Poznámka

Toto je experimentální třída, která se může kdykoli změnit. Další informace najdete tady: https://aka.ms/azuremlexperimental.

Vytvoří krok kanálu Azure ML, který spustí skript jazyka R.

Vytvořte krok kanálu Azure ML, který spouští skript jazyka R.

ZASTARALÉ. Místo toho CommandStep použijte. Příklad najdete v tématu Jak spouštět skripty jazyka R v kanálech pomocí CommandStep.

SynapseSparkStep

Poznámka

Toto je experimentální třída, která se může kdykoli změnit. Další informace najdete tady: https://aka.ms/azuremlexperimental.

Vytvoří krok Synapse v Azure ML, který odešle a spustí skript Pythonu.

Vytvořte krok kanálu Azure ML, který spustí úlohu Sparku ve fondu synapse Sparku.