SKLearn 클래스
Scikit-learn 실험에서 학습을 위한 예측 도구를 만듭니다.
사용되지 않습니다. 사용자 고유의 정의된 환경 또는 AzureML-Tutorial 큐레이팅된 환경에서 ScriptRunConfig 개체를 사용합니다. ScriptRunConfig를 사용하여 SKLearn 실험 실행을 구성하는 방법에 대한 소개는 Azure Machine Learning을 사용한 대규모 scikit-learn 모델 학습을 참조하세요.
이 예측 도구는 단일 노드 CPU 학습만 지원합니다.
지원되는 버전: 0.20.3
Scikit-learn 예측 도구를 초기화합니다.
- 상속
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
생성자
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
매개 변수
Name | Description |
---|---|
source_directory
필수
|
실험 구성 파일을 포함하는 로컬 디렉터리입니다. |
compute_target
필수
|
학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다. |
vm_size
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기. |
vm_priority
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다. 지원되는 값: ‘dedicated’ 및 ‘lowpriority’. 입력에서 |
entry_script
필수
|
학습을 시작하는 데 사용되는 파일의 상대 경로를 나타내는 문자열입니다. |
script_params
필수
|
|
custom_docker_image
필수
|
학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. |
image_registry_details
필수
|
Docker 이미지 레지스트리의 세부 정보입니다. |
user_managed
필수
|
Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. False는 AzureML이 conda 종속성 사양에 따라 Python 환경을 만들 것을 의미합니다. |
conda_packages
필수
|
실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다. |
pip_packages
필수
|
실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다. |
conda_dependencies_file_path
필수
|
conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다.
이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.
|
pip_requirements_file_path
필수
|
pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다.
|
conda_dependencies_file
필수
|
conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다.
이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.
|
pip_requirements_file
필수
|
pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다.
|
environment_variables
필수
|
환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다. |
environment_definition
필수
|
실험에 대한 환경 정의에는 PythonSection, DockerSection, 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 |
inputs
필수
|
입력으로 사용할 DataReference 또는 DatasetConsumptionConfig 개체의 목록입니다. |
shm_size
필수
|
Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본 azureml.core.environment._DEFAULT_SHM_SIZE가 사용됩니다. |
resume_from
필수
|
실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다. |
max_run_duration_seconds
필수
|
실행에 허용되는 최대 시간입니다. Azure ML은 이 값보다 오래 걸리는 경우 실행을 자동으로 취소하려고 시도합니다. |
framework_version
필수
|
학습 코드를 실행하는 데 사용할 Scikit-learn 버전입니다.
|
source_directory
필수
|
실험 구성 파일을 포함하는 로컬 디렉터리입니다. |
compute_target
필수
|
학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다. |
vm_size
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기. |
vm_priority
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다. 지원되는 값: ‘dedicated’ 및 ‘lowpriority’. 입력에서 |
entry_script
필수
|
학습을 시작하는 데 사용되는 파일의 상대 경로를 나타내는 문자열입니다. |
script_params
필수
|
|
use_docker
필수
|
실험을 실행할 환경이 Docker 기반이어야 하는지 여부를 나타내는 부울 값입니다. |
custom_docker_image
필수
|
학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. |
image_registry_details
필수
|
Docker 이미지 레지스트리의 세부 정보입니다. |
user_managed
필수
|
Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. False는 AzureML이 conda 종속성 사양에 따라 Python 환경을 만들 것을 의미합니다. |
conda_packages
필수
|
실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다. |
pip_packages
필수
|
실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다. |
conda_dependencies_file_path
필수
|
conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.
|
pip_requirements_file_path
필수
|
pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다.
|
conda_dependencies_file
필수
|
conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.
|
pip_requirements_file
필수
|
pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다.
|
environment_variables
필수
|
환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다. |
environment_definition
필수
|
실험에 대한 환경 정의에는 PythonSection, DockerSection, 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 |
inputs
필수
|
azureml.data.data_reference 목록입니다. 입력으로 사용할 DataReference 개체입니다. |
shm_size
필수
|
Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본 azureml.core.environment._DEFAULT_SHM_SIZE가 사용됩니다. |
resume_from
필수
|
실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다. |
max_run_duration_seconds
필수
|
실행에 허용되는 최대 시간입니다. Azure ML은 이 값보다 오래 걸리는 경우 실행을 자동으로 취소하려고 시도합니다. |
framework_version
필수
|
학습 코드를 실행하는 데 사용할 Scikit-learn 버전입니다.
|
_enable_optimized_mode
필수
|
더 빠른 환경 준비를 위해 미리 빌드된 프레임워크 이미지를 사용하여 증분 환경 빌드를 사용하도록 설정합니다. 미리 빌드된 프레임워크 이미지는 프레임워크 종속성이 미리 설치된 Azure ML 기본 CPU/GPU 기본 이미지를 기반으로 빌드됩니다. |
_disable_validation
필수
|
제출을 실행하기 전에 스크립트 유효성 검사를 사용하지 않도록 설정합니다. 기본값은 true입니다. |
_show_lint_warnings
필수
|
스크립트 린팅 경고를 표시합니다. 기본값은 False입니다. |
_show_package_warnings
필수
|
패키지 유효성 검사 경고를 표시합니다. 기본값은 False입니다. |
설명
학습 작업을 제출할 때 Azure ML은 Docker 컨테이너 내부의 conda 환경에서 스크립트를 실행합니다. SKLearn 컨테이너에는 다음과 같은 종속성이 설치되어 있습니다.
종속성 | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | 최신 | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Docker 이미지는 Ubuntu 16.04를 확장합니다.
추가 종속성을 설치해야 하는 경우 pip_packages
또는 conda_packages
매개 변수를 사용하거나, pip_requirements_file
또는 conda_dependencies_file
파일을 제공하면 됩니다. 또는 사용자 고유의 이미지를 만들고 custom_docker_image
매개 변수를 예측 도구 생성자에 전달해도 됩니다.
특성
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'