Delen via


AzureBatchStep Klas

Hiermee maakt u een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Opmerking: deze stap biedt geen ondersteuning voor het uploaden/downloaden van mappen en de inhoud ervan.

Zie het notebook https://aka.ms/pl-azbatchvoor een voorbeeld van het gebruik van AzureBatchStep.

Maak een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Overname
azureml.pipeline.core._azurebatch_step_base._AzureBatchStepBase
AzureBatchStep

Constructor

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

Parameters

Name Description
name
Vereist
str

[Vereist] De naam van de stap.

create_pool

Hiermee wordt aangegeven of de pool moet worden gemaakt voordat de taken worden uitgevoerd.

Default value: False
pool_id
str

[Vereist] De id van de pool waarin de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden.

Default value: None
delete_batch_job_after_finish

Hiermee wordt aangegeven of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid.

Default value: True
delete_batch_pool_after_finish

Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid.

Default value: False
is_positive_exit_code_failure

Geeft aan of de taak mislukt als de taak bestaat met een positieve code.

Default value: True
vm_image_urn
str

Als create_pool waar is en de VM VirtualMachineConfiguration gebruikt. Waardenotatie: urn:publisher:offer:sku. Bijvoorbeeld: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter.

Default value: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
run_task_as_admin

Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden.

Default value: False
target_compute_nodes
int

Als create_pool waar is, wordt aangegeven hoeveel rekenknooppunten aan de pool worden toegevoegd.

Default value: 1
vm_size
str

Als create_pool waar is, wordt de grootte van de virtuele machine van de rekenknooppunten aangegeven.

Default value: standard_d1_v2
source_directory
str

Een lokale map met de binaire bestanden van de module, het uitvoerbare bestand, assembly's, enzovoort.

Default value: None
executable
str

[Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak.

Default value: None
arguments
str

Argumenten voor de opdracht/het uitvoerbare bestand.

Default value: None
inputs

Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er een map gemaakt voor elke invoer. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld input1 is en het relatieve pad in de opslag een of andere/relatieve/pad/dat/kan/zijn/echt/lang/inputfile.txtis, is het bestandspad op de berekening: ./input1/inputfile.txt. Wanneer de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op het rekendoel.

Default value: None
outputs

Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt er voor elke uitvoer een map gemaakt voordat de taak wordt uitgevoerd. De mapnaam is hetzelfde als de naam van de uitvoer. De veronderstelling is dat de taak de uitvoer in die map plaatst.

Default value: None
allow_reuse

Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.

Default value: True
compute_target

[Vereist] Een BatchCompute-berekening waarin de taak wordt uitgevoerd.

Default value: None
version
str

Een optionele versietag om een wijziging in de functionaliteit voor de module aan te geven.

Default value: None
name
Vereist
str

[Vereist] De naam van de stap.

create_pool
Vereist

Hiermee wordt aangegeven of de pool moet worden gemaakt voordat de taken worden uitgevoerd.

pool_id
Vereist
str

[Vereist] De id van de pool waarin de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden.

delete_batch_job_after_finish
Vereist

Hiermee wordt aangegeven of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid.

delete_batch_pool_after_finish
Vereist

Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid.

is_positive_exit_code_failure
Vereist

Geeft aan of de taak mislukt als de taak bestaat met een positieve code.

vm_image_urn
Vereist
str

Als create_pool waar is en de VM VirtualMachineConfiguration gebruikt. Waardenotatie: urn:publisher:offer:sku. Bijvoorbeeld: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter.

run_task_as_admin
Vereist

Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden.

target_compute_nodes
Vereist
int

Als create_pool waar is, wordt aangegeven hoeveel rekenknooppunten aan de pool worden toegevoegd.

vm_size
Vereist
str

Als create_pool waar is, wordt de grootte van de virtuele machine van de rekenknooppunten aangegeven.

source_directory
Vereist
str

Een lokale map die de binaire bestanden, uitvoerbare bestanden, assembly's, enzovoort van de module bevat.

executable
Vereist
str

[Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak.

arguments
Vereist

Argumenten voor de opdracht/het uitvoerbare bestand.

inputs
Vereist

Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er een map gemaakt voor elke invoer. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld input1 is en het relatieve pad in de opslag een of andere/relatieve/pad/dat/kan/zijn/echt/lang/inputfile.txtis, is het bestandspad op de berekening: ./input1/inputfile.txt. Als de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op de berekening.

outputs
Vereist

Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt er voor elke uitvoer een map gemaakt voordat de taak wordt uitgevoerd. De mapnaam is hetzelfde als de naam van de uitvoer. De veronderstelling is dat de taak de uitvoer in die map heeft.

allow_reuse
Vereist

Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.

compute_target
Vereist

[Vereist] Een BatchCompute-berekening waarin de taak wordt uitgevoerd.

version
Vereist
str

Een optionele versietag om een wijziging in de functionaliteit voor de module aan te geven.

Opmerkingen

In het volgende voorbeeld ziet u hoe u AzureBatchStep gebruikt in een Azure Machine Learning-pijplijn.


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

Methoden

create_node

Maak een knooppunt vanuit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node

Maak een knooppunt vanuit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node(graph, default_datastore, context)

Parameters

Name Description
graph
Vereist

Het grafiekobject waaraan u het knooppunt wilt toevoegen.

default_datastore
Vereist

Het standaardgegevensarchief.

context
Vereist
<xref:azureml.pipeline.core._GraphContext>

De grafiekcontext.

Retouren

Type Description

Het gemaakte knooppunt.