AzureBatchStep Klas
Hiermee maakt u een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.
Opmerking: deze stap biedt geen ondersteuning voor het uploaden/downloaden van mappen en de inhoud ervan.
Zie het notebook https://aka.ms/pl-azbatchvoor een voorbeeld van het gebruik van AzureBatchStep.
Maak een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.
- Overname
-
azureml.pipeline.core._azurebatch_step_base._AzureBatchStepBaseAzureBatchStep
Constructor
AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)
Parameters
Name | Description |
---|---|
name
Vereist
|
[Vereist] De naam van de stap. |
create_pool
|
Hiermee wordt aangegeven of de pool moet worden gemaakt voordat de taken worden uitgevoerd. Default value: False
|
pool_id
|
[Vereist] De id van de pool waarin de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden. Default value: None
|
delete_batch_job_after_finish
|
Hiermee wordt aangegeven of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid. Default value: True
|
delete_batch_pool_after_finish
|
Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid. Default value: False
|
is_positive_exit_code_failure
|
Geeft aan of de taak mislukt als de taak bestaat met een positieve code. Default value: True
|
vm_image_urn
|
Als Default value: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
|
run_task_as_admin
|
Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden. Default value: False
|
target_compute_nodes
|
Als Default value: 1
|
vm_size
|
Als Default value: standard_d1_v2
|
source_directory
|
Een lokale map met de binaire bestanden van de module, het uitvoerbare bestand, assembly's, enzovoort. Default value: None
|
executable
|
[Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak. Default value: None
|
arguments
|
Argumenten voor de opdracht/het uitvoerbare bestand. Default value: None
|
inputs
|
Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er een map gemaakt voor elke invoer. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld input1 is en het relatieve pad in de opslag een of andere/relatieve/pad/dat/kan/zijn/echt/lang/inputfile.txtis, is het bestandspad op de berekening: ./input1/inputfile.txt. Wanneer de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op het rekendoel. Default value: None
|
outputs
|
Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt er voor elke uitvoer een map gemaakt voordat de taak wordt uitgevoerd. De mapnaam is hetzelfde als de naam van de uitvoer. De veronderstelling is dat de taak de uitvoer in die map plaatst. Default value: None
|
allow_reuse
|
Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd. Default value: True
|
compute_target
|
[Vereist] Een BatchCompute-berekening waarin de taak wordt uitgevoerd. Default value: None
|
version
|
Een optionele versietag om een wijziging in de functionaliteit voor de module aan te geven. Default value: None
|
name
Vereist
|
[Vereist] De naam van de stap. |
create_pool
Vereist
|
Hiermee wordt aangegeven of de pool moet worden gemaakt voordat de taken worden uitgevoerd. |
pool_id
Vereist
|
[Vereist] De id van de pool waarin de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden. |
delete_batch_job_after_finish
Vereist
|
Hiermee wordt aangegeven of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid. |
delete_batch_pool_after_finish
Vereist
|
Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid. |
is_positive_exit_code_failure
Vereist
|
Geeft aan of de taak mislukt als de taak bestaat met een positieve code. |
vm_image_urn
Vereist
|
Als |
run_task_as_admin
Vereist
|
Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden. |
target_compute_nodes
Vereist
|
Als |
vm_size
Vereist
|
Als |
source_directory
Vereist
|
Een lokale map die de binaire bestanden, uitvoerbare bestanden, assembly's, enzovoort van de module bevat. |
executable
Vereist
|
[Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak. |
arguments
Vereist
|
Argumenten voor de opdracht/het uitvoerbare bestand. |
inputs
Vereist
|
Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er een map gemaakt voor elke invoer. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld input1 is en het relatieve pad in de opslag een of andere/relatieve/pad/dat/kan/zijn/echt/lang/inputfile.txtis, is het bestandspad op de berekening: ./input1/inputfile.txt. Als de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op de berekening. |
outputs
Vereist
|
Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt er voor elke uitvoer een map gemaakt voordat de taak wordt uitgevoerd. De mapnaam is hetzelfde als de naam van de uitvoer. De veronderstelling is dat de taak de uitvoer in die map heeft. |
allow_reuse
Vereist
|
Hiermee wordt aangegeven of de vorige resultaten opnieuw moeten worden gebruikt wanneer de stap opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd. |
compute_target
Vereist
|
[Vereist] Een BatchCompute-berekening waarin de taak wordt uitgevoerd. |
version
Vereist
|
Een optionele versietag om een wijziging in de functionaliteit voor de module aan te geven. |
Opmerkingen
In het volgende voorbeeld ziet u hoe u AzureBatchStep gebruikt in een Azure Machine Learning-pijplijn.
step = AzureBatchStep(
name="Azure Batch Job",
pool_id="MyPoolName", # Replace this with the pool name of your choice
inputs=[testdata],
outputs=[outputdata],
executable="azurebatch.cmd",
arguments=[testdata, outputdata],
compute_target=batch_compute,
source_directory=binaries_folder,
)
Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb
Methoden
create_node |
Maak een knooppunt vanuit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek. Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt. |
create_node
Maak een knooppunt vanuit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.
Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.
create_node(graph, default_datastore, context)
Parameters
Name | Description |
---|---|
graph
Vereist
|
Het grafiekobject waaraan u het knooppunt wilt toevoegen. |
default_datastore
Vereist
|
Het standaardgegevensarchief. |
context
Vereist
|
<xref:azureml.pipeline.core._GraphContext>
De grafiekcontext. |
Retouren
Type | Description |
---|---|
Het gemaakte knooppunt. |