다음을 통해 공유


SKLearn 클래스

Scikit-learn 실험에서 학습을 위한 예측 도구를 만듭니다.

사용되지 않습니다. 사용자 고유의 정의된 환경 또는 AzureML-Tutorial 큐레이팅된 환경에서 ScriptRunConfig 개체를 사용합니다. ScriptRunConfig를 사용하여 SKLearn 실험 실행을 구성하는 방법에 대한 소개는 Azure Machine Learning을 사용한 대규모 scikit-learn 모델 학습을 참조하세요.

이 예측 도구는 단일 노드 CPU 학습만 지원합니다.

지원되는 버전: 0.20.3

Scikit-learn 예측 도구를 초기화합니다.

상속
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

생성자

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

매개 변수

Name Description
source_directory
필수
str

실험 구성 파일을 포함하는 로컬 디렉터리입니다.

compute_target
필수

학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다.

vm_size
필수
str

학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다.

지원되는 값: 모든 Azure VM 크기.

vm_priority
필수
str

학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다.

지원되는 값: ‘dedicated’ 및 ‘lowpriority’.

입력에서 vm_size param이 지정된 경우에만 적용됩니다.

entry_script
필수
str

학습을 시작하는 데 사용되는 파일의 상대 경로를 나타내는 문자열입니다.

script_params
필수

entry_script에 지정된 학습 스크립트에 전달할 명령줄 인수 사전입니다.

custom_docker_image
필수
str

학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

image_registry_details
필수

Docker 이미지 레지스트리의 세부 정보입니다.

user_managed
필수

Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. False는 AzureML이 conda 종속성 사양에 따라 Python 환경을 만들 것을 의미합니다.

conda_packages
필수

실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다.

pip_packages
필수

실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다.

conda_dependencies_file_path
필수
str

conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. conda_packages 매개 변수와 함께 제공할 수 있습니다. 사용되지 않습니다. conda_dependencies_file 매개 변수를 사용합니다.

pip_requirements_file_path
필수
str

pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다. pip_packages 매개 변수와 함께 제공할 수 있습니다. 사용되지 않습니다. pip_requirements_file 매개 변수를 사용합니다.

conda_dependencies_file
필수
str

conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. conda_packages 매개 변수와 함께 제공할 수 있습니다.

pip_requirements_file
필수
str

pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다. pip_packages 매개 변수와 함께 제공할 수 있습니다.

environment_variables
필수

환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다.

environment_definition
필수

실험에 대한 환경 정의에는 PythonSection, DockerSection, 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 environment_definition 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 use_gpu, custom_docker_image, conda_packages 또는 pip_packages와 같은 다른 환경 관련 매개 변수보다 우선 적용됩니다. 잘못된 조합에 대한 오류가 보고됩니다.

inputs
필수

입력으로 사용할 DataReference 또는 DatasetConsumptionConfig 개체의 목록입니다.

shm_size
필수
str

Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본 azureml.core.environment._DEFAULT_SHM_SIZE가 사용됩니다.

resume_from
필수

실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다.

max_run_duration_seconds
필수
int

실행에 허용되는 최대 시간입니다. Azure ML은 이 값보다 오래 걸리는 경우 실행을 자동으로 취소하려고 시도합니다.

framework_version
필수
str

학습 코드를 실행하는 데 사용할 Scikit-learn 버전입니다. SKLearn.get_supported_versions()는 현재 SDK에서 지원하는 버전 목록을 반환합니다.

source_directory
필수
str

실험 구성 파일을 포함하는 로컬 디렉터리입니다.

compute_target
필수

학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다.

vm_size
필수
str

학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기.

vm_priority
필수
str

학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다.

지원되는 값: ‘dedicated’ 및 ‘lowpriority’.

입력에서 vm_size param이 지정된 경우에만 적용됩니다.

entry_script
필수
str

학습을 시작하는 데 사용되는 파일의 상대 경로를 나타내는 문자열입니다.

script_params
필수

entry_script에 지정된 학습 스크립트에 전달할 명령줄 인수 사전입니다.

use_docker
필수

실험을 실행할 환경이 Docker 기반이어야 하는지 여부를 나타내는 부울 값입니다.

custom_docker_image
필수
str

학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

image_registry_details
필수

Docker 이미지 레지스트리의 세부 정보입니다.

user_managed
필수

Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. False는 AzureML이 conda 종속성 사양에 따라 Python 환경을 만들 것을 의미합니다.

conda_packages
필수

실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다.

pip_packages
필수

실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다.

conda_dependencies_file_path
필수
str

conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. conda_packages 매개 변수와 함께 제공할 수 있습니다. 사용되지 않습니다. conda_dependencies_file 매개 변수를 사용합니다.

pip_requirements_file_path
필수
str

pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다. pip_packages 매개 변수와 함께 제공할 수 있습니다. 사용되지 않습니다. pip_requirements_file 매개 변수를 사용합니다.

conda_dependencies_file
필수
str

conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. conda_packages 매개 변수와 함께 제공할 수 있습니다.

pip_requirements_file
필수
str

pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다. pip_packages 매개 변수와 함께 제공할 수 있습니다.

environment_variables
필수

환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다.

environment_definition
필수

실험에 대한 환경 정의에는 PythonSection, DockerSection, 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 environment_definition 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 use_gpu, custom_docker_image, conda_packages 또는 pip_packages와 같은 다른 환경 관련 매개 변수보다 우선 적용됩니다. 잘못된 조합에 대한 오류가 보고됩니다.

inputs
필수

azureml.data.data_reference 목록입니다. 입력으로 사용할 DataReference 개체입니다.

shm_size
필수
str

Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본 azureml.core.environment._DEFAULT_SHM_SIZE가 사용됩니다.

resume_from
필수

실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다.

max_run_duration_seconds
필수
int

실행에 허용되는 최대 시간입니다. Azure ML은 이 값보다 오래 걸리는 경우 실행을 자동으로 취소하려고 시도합니다.

framework_version
필수
str

학습 코드를 실행하는 데 사용할 Scikit-learn 버전입니다. SKLearn.get_supported_versions()는 현재 SDK에서 지원하는 버전 목록을 반환합니다.

_enable_optimized_mode
필수

더 빠른 환경 준비를 위해 미리 빌드된 프레임워크 이미지를 사용하여 증분 환경 빌드를 사용하도록 설정합니다. 미리 빌드된 프레임워크 이미지는 프레임워크 종속성이 미리 설치된 Azure ML 기본 CPU/GPU 기본 이미지를 기반으로 빌드됩니다.

_disable_validation
필수

제출을 실행하기 전에 스크립트 유효성 검사를 사용하지 않도록 설정합니다. 기본값은 true입니다.

_show_lint_warnings
필수

스크립트 린팅 경고를 표시합니다. 기본값은 False입니다.

_show_package_warnings
필수

패키지 유효성 검사 경고를 표시합니다. 기본값은 False입니다.

설명

학습 작업을 제출할 때 Azure ML은 Docker 컨테이너 내부의 conda 환경에서 스크립트를 실행합니다. SKLearn 컨테이너에는 다음과 같은 종속성이 설치되어 있습니다.

종속성 | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | 최신 | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Docker 이미지는 Ubuntu 16.04를 확장합니다.

추가 종속성을 설치해야 하는 경우 pip_packages 또는 conda_packages 매개 변수를 사용하거나, pip_requirements_file 또는 conda_dependencies_file 파일을 제공하면 됩니다. 또는 사용자 고유의 이미지를 만들고 custom_docker_image 매개 변수를 예측 도구 생성자에 전달해도 됩니다.

특성

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'