SKLearn Třída
Vytvoří estimátor pro trénování v experimentech Scikit-learn.
ZASTARALÉ. Použijte objekt s ScriptRunConfig vlastním definovaným prostředím nebo AzureML-Tutorial kurátorovaným prostředím. Úvod ke konfiguraci spuštění experimentů SKLearn pomocí ScriptRunConfig najdete v tématu trénování modelů scikit-learn ve velkém s využitím služby Azure Machine Learning.
Tento estimátor podporuje pouze trénování procesoru s jedním uzlem.
Podporované verze: 0.20.3
Inicializujte estimátor Scikit-learn.
- Dědičnost
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Konstruktor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parametry
Name | Description |
---|---|
source_directory
Vyžadováno
|
Místní adresář obsahující konfigurační soubory experimentu. |
compute_target
Vyžadováno
|
AbstractComputeTarget nebo
str
Cílový výpočetní objekt, ve kterém bude probíhat trénování. Může to být buď objekt, nebo řetězec "local". |
vm_size
Vyžadováno
|
Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure. |
vm_priority
Vyžadováno
|
Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "vyhrazené". Podporované hodnoty: "dedicated" a "lowpriority". To se projeví pouze v |
entry_script
Vyžadováno
|
Řetězec představující relativní cestu k souboru použitému k zahájení trénování. |
script_params
Vyžadováno
|
Slovník argumentů příkazového řádku, které se mají předat vašemu trénovacímu skriptu zadanému v |
custom_docker_image
Vyžadováno
|
Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. |
image_registry_details
Vyžadováno
|
Podrobnosti o registru imagí Dockeru |
user_managed
Vyžadováno
|
Určuje, jestli Azure ML opakovaně používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda. |
conda_packages
Vyžadováno
|
Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment. |
pip_packages
Vyžadováno
|
Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment. |
conda_dependencies_file_path
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda.
Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem |
pip_requirements_file_path
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem |
conda_dependencies_file
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda.
Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem |
pip_requirements_file
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem |
environment_variables
Vyžadováno
|
Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript. |
environment_definition
Vyžadováno
|
Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Všechny možnosti prostředí, které nejsou přímo vystaveny prostřednictvím jiných parametrů pro konstrukci estimátoru, lze nastavit pomocí |
inputs
Vyžadováno
|
Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup. |
shm_size
Vyžadováno
|
Velikost bloku sdílené paměti kontejneru Dockeru Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE. |
resume_from
Vyžadováno
|
Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých se má experiment pokračovat. |
max_run_duration_seconds
Vyžadováno
|
Maximální povolený čas pro spuštění. Azure ML se pokusí automaticky zrušit spuštění, pokud trvá déle, než je tato hodnota. |
framework_version
Vyžadováno
|
Verze Scikit-learn, která se má použít ke spouštění trénovacího kódu.
|
source_directory
Vyžadováno
|
Místní adresář obsahující konfigurační soubory experimentu. |
compute_target
Vyžadováno
|
AbstractComputeTarget nebo
str
Cílový výpočetní objekt, ve kterém bude probíhat trénování. Může to být buď objekt, nebo řetězec "local". |
vm_size
Vyžadováno
|
Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure. |
vm_priority
Vyžadováno
|
Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "vyhrazené". Podporované hodnoty: "dedicated" a "lowpriority". To se projeví pouze v |
entry_script
Vyžadováno
|
Řetězec představující relativní cestu k souboru použitému k zahájení trénování. |
script_params
Vyžadováno
|
Slovník argumentů příkazového řádku, které se mají předat vašemu trénovacímu skriptu zadanému v |
use_docker
Vyžadováno
|
Logická hodnota označující, jestli by prostředí pro spuštění experimentu mělo být založené na Dockeru. |
custom_docker_image
Vyžadováno
|
Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. |
image_registry_details
Vyžadováno
|
Podrobnosti o registru imagí Dockeru |
user_managed
Vyžadováno
|
Určuje, jestli Azure ML opakovaně používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda. |
conda_packages
Vyžadováno
|
Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment. |
pip_packages
Vyžadováno
|
Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment. |
conda_dependencies_file_path
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem |
pip_requirements_file_path
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem |
conda_dependencies_file
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem |
pip_requirements_file
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem |
environment_variables
Vyžadováno
|
Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript. |
environment_definition
Vyžadováno
|
Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Všechny možnosti prostředí, které nejsou přímo vystaveny prostřednictvím jiných parametrů pro konstrukci estimátoru, lze nastavit pomocí |
inputs
Vyžadováno
|
Seznam azureml.data.data_reference. Objekty DataReference, které se použijí jako vstup. |
shm_size
Vyžadováno
|
Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE. |
resume_from
Vyžadováno
|
Cesta k datům obsahující kontrolní bod nebo soubory modelu, ze kterých chcete pokračovat v experimentu. |
max_run_duration_seconds
Vyžadováno
|
Maximální povolený čas pro spuštění. Azure ML se pokusí automaticky zrušit spuštění, pokud trvá déle než tato hodnota. |
framework_version
Vyžadováno
|
Verze Scikit-learn, která se použije ke spouštění trénovacího kódu.
|
_enable_optimized_mode
Vyžadováno
|
Povolte přírůstkové sestavení prostředí s předem sestavenými imagemi architektury pro rychlejší přípravu prostředí. Předem sestavená image architektury je postavená na výchozích imagích procesoru/GPU Azure ML s předinstalovanými závislostmi architektury. |
_disable_validation
Vyžadováno
|
Před spuštěním odeslání zakažte ověřování skriptů. Výchozí hodnota je True. |
_show_lint_warnings
Vyžadováno
|
Zobrazit upozornění na lintování skriptů Výchozí hodnota je Nepravda. |
_show_package_warnings
Vyžadováno
|
Zobrazit upozornění ověření balíčku. Výchozí hodnota je Nepravda. |
Poznámky
Při odesílání trénovací úlohy Azure ML spustí váš skript v prostředí conda v rámci kontejneru Dockeru. Kontejnery SKLearn mají nainstalované následující závislosti.
Závislosti | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Nejnovější | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Image Dockeru rozšiřují Ubuntu 16.04.
Pokud potřebujete nainstalovat další závislosti, můžete použít pip_packages
parametry nebo conda_packages
nebo zadat pip_requirements_file
soubor nebo conda_dependencies_file
. Alternativně můžete vytvořit vlastní image a předat custom_docker_image
parametr konstruktoru estimator.
Atributy
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'