Delen via


SKLearn Klas

Hiermee maakt u een estimator voor training in Scikit-learn-experimenten.

AFGEKEURD. Gebruik het ScriptRunConfig object met uw eigen gedefinieerde omgeving of de AzureML-Tutorial gecureerde omgeving. Zie Scikit-learn-modellen op schaal trainen met Azure Machine Learning voor een inleiding tot het configureren van SKLearn-experimentuitvoeringen met ScriptRunConfig.

Deze estimator ondersteunt alleen CPU-training met één knooppunt.

Ondersteunde versies: 0.20.3

Initialiseer een Scikit-learn-estimator.

Overname
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Constructor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameters

Name Description
source_directory
Vereist
str

Een lokale map met experimentconfiguratiebestanden.

compute_target
Vereist

Het rekendoel waar de training plaatsvindt. Dit kan een object of de tekenreeks 'lokaal' zijn.

vm_size
Vereist
str

De VM-grootte van het rekendoel dat voor de training wordt gemaakt.

Ondersteunde waarden: elke grootte van azure-VM's.

vm_priority
Vereist
str

De VM-prioriteit van het rekendoel dat voor de training wordt gemaakt. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.

Ondersteunde waarden: 'dedicated' en 'lowpriority'.

Dit wordt alleen van kracht wanneer de vm_size param is opgegeven in de invoer.

entry_script
Vereist
str

Een tekenreeks die het relatieve pad vertegenwoordigt naar het bestand dat wordt gebruikt om de training te starten.

script_params
Vereist

Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script.

custom_docker_image
Vereist
str

De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt. Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën.

image_registry_details
Vereist

De details van het register van de Docker-installatiekopieën.

user_managed
Vereist

Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. False betekent dat AzureML een Python-omgeving maakt op basis van de specificatie conda-afhankelijkheden.

conda_packages
Vereist

Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

pip_packages
Vereist

Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

conda_dependencies_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter . AFGEKEURD. Gebruik de conda_dependencies_file parameter .

pip_requirements_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt. Dit kan worden opgegeven in combinatie met de pip_packages parameter . AFGEKEURD. Gebruik de pip_requirements_file parameter .

conda_dependencies_file
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter .

pip_requirements_file
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt. Dit kan worden opgegeven in combinatie met de pip_packages parameter .

environment_variables
Vereist

Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.

environment_definition
Vereist

De omgevingsdefinitie voor een experiment omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks beschikbaar wordt gemaakt via andere parameters voor de constructie van de estimator, kan worden ingesteld met behulp van environment_definition de parameter . Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu, custom_docker_image, conda_packagesof pip_packages. Fouten worden gerapporteerd als ongeldige combinaties.

inputs
Vereist

Een lijst met DataReferenceDatasetConsumptionConfig of-objecten die als invoer moeten worden gebruikt.

shm_size
Vereist
str

De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard azureml.core.environment._DEFAULT_SHM_SIZE gebruikt.

resume_from
Vereist

Het gegevenspad met het controlepunt of de modelbestanden van waaruit het experiment moet worden hervat.

max_run_duration_seconds
Vereist
int

De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als deze langer duurt dan deze waarde.

framework_version
Vereist
str

De Scikit-learn-versie die moet worden gebruikt voor het uitvoeren van trainingscode. SKLearn.get_supported_versions() retourneert een lijst met de versies die worden ondersteund door de huidige SDK.

source_directory
Vereist
str

Een lokale map met experimentconfiguratiebestanden.

compute_target
Vereist

Het rekendoel waar de training plaatsvindt. Dit kan een object of de tekenreeks 'lokaal' zijn.

vm_size
Vereist
str

De VM-grootte van het rekendoel dat voor de training wordt gemaakt. Ondersteunde waarden: elke grootte van azure-VM's.

vm_priority
Vereist
str

De VM-prioriteit van het rekendoel dat voor de training wordt gemaakt. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.

Ondersteunde waarden: 'dedicated' en 'lowpriority'.

Dit wordt alleen van kracht wanneer de vm_size param is opgegeven in de invoer.

entry_script
Vereist
str

Een tekenreeks die het relatieve pad vertegenwoordigt naar het bestand dat wordt gebruikt om de training te starten.

script_params
Vereist

Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script.

use_docker
Vereist

Een boolwaarde die aangeeft of de omgeving voor het uitvoeren van het experiment docker moet zijn.

custom_docker_image
Vereist
str

De naam van de Docker-installatiekopieën van waaruit de installatiekopieën voor training worden gemaakt. Als dit niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën.

image_registry_details
Vereist

De details van het register van de Docker-installatiekopieën.

user_managed
Vereist

Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. False betekent dat AzureML een Python-omgeving maakt op basis van de specificatie conda-afhankelijkheden.

conda_packages
Vereist

Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

pip_packages
Vereist

Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

conda_dependencies_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter . AFGEKEURD. Gebruik de conda_dependencies_file parameter .

pip_requirements_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt. Dit kan worden opgegeven in combinatie met de pip_packages parameter . AFGEKEURD. Gebruik de pip_requirements_file parameter .

conda_dependencies_file
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden vertegenwoordigt. Indien opgegeven, installeert Azure ML geen framework-gerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter .

pip_requirements_file
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten vertegenwoordigt. Dit kan worden opgegeven in combinatie met de pip_packages parameter .

environment_variables
Vereist

Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.

environment_definition
Vereist

De omgevingsdefinitie voor een experiment omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks beschikbaar wordt gemaakt via andere parameters voor de constructie van de estimator, kan worden ingesteld met behulp van environment_definition de parameter . Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu, custom_docker_image, conda_packagesof pip_packages. Fouten worden gerapporteerd als ongeldige combinaties.

inputs
Vereist

Een lijst met azureml.data.data_reference. DataReference-objecten die als invoer moeten worden gebruikt.

shm_size
Vereist
str

De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard azureml.core.environment._DEFAULT_SHM_SIZE gebruikt.

resume_from
Vereist

Het gegevenspad met het controlepunt of de modelbestanden waaruit het experiment moet worden hervat.

max_run_duration_seconds
Vereist
int

De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als het langer duurt dan deze waarde.

framework_version
Vereist
str

De Scikit-learn-versie die moet worden gebruikt voor het uitvoeren van trainingscode. SKLearn.get_supported_versions() retourneert een lijst met de versies die worden ondersteund door de huidige SDK.

_enable_optimized_mode
Vereist

Incrementele omgevingsbuild inschakelen met vooraf gebouwde frameworkinstallatiekopieën voor een snellere voorbereiding van de omgeving. Een vooraf gebouwde frameworkinstallatiekopie is gebouwd op basisinstallatiekopieën van Azure ML standaard CPU/GPU met vooraf geïnstalleerde frameworkafhankelijkheden.

_disable_validation
Vereist

Schakel scriptvalidatie uit voordat u de verzending uitvoert. De standaardwaarde is True.

_show_lint_warnings
Vereist

Waarschuwingen voor linting van scripts weergeven. De standaardwaarde is False.

_show_package_warnings
Vereist

Waarschuwingen voor pakketvalidatie weergeven. De standaardwaarde is False.

Opmerkingen

Wanneer u een trainingstaak verzendt, voert Azure ML uw script uit in een Conda-omgeving binnen een Docker-container. SkLearn-containers hebben de volgende afhankelijkheden geïnstalleerd.

Afhankelijkheden | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Meest recente | IntelMpi | 3.222 2018 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

De Docker-installatiekopieën breiden Ubuntu 16.04 uit.

Als u aanvullende afhankelijkheden wilt installeren, kunt u de pip_packages parameters of conda_packages gebruiken, of u kunt het pip_requirements_file bestand of conda_dependencies_file opgeven. U kunt ook uw eigen installatiekopieën bouwen en de custom_docker_image parameter doorgeven aan de estimator-constructor.

Kenmerken

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'