Estimator 클래스
제공된 프레임워크를 사용하여 데이터를 학습하기 위한 일반 예측 도구를 나타냅니다.
사용되지 않습니다. 자체 정의된 환경 또는 Azure ML 큐레이트 환경에서 ScriptRunConfig 개체를 사용합니다. ScriptRunConfig를 사용한 실험 실행 구성에 대한 소개는 학습 실행 구성 및 제출을 참조하세요.
이 클래스는 Azure Machine Learning이 미리 구성된 예측 도구가 없는 Machine Learning 프레임워크와 함께 사용하도록 설계되었습니다. Chainer, PyTorch, TensorFlow 및 SKLearn에 대해 사전 구성된 예측 도구가 있습니다. 미리 구성되지 않은 예측 도구를 만들려면 예측 도구를 사용하여 Azure Machine Learning으로 모델 학습을 참조하세요.
Estimator 클래스는 스크립트 실행 방법을 지정하는 작업을 단순화하는 데 도움이 되도록 실행 구성 정보를 래핑합니다. 단일 노드 및 다중 노드 실행을 지원합니다. 예측 도구를 실행하면 학습 스크립트에 지정된 출력 디렉터리에 모델이 생성됩니다.
예측 도구를 초기화합니다.
azureml.core.environment._DEFAULT_SHM_SIZE 사용됩니다. 자세한 내용은 Docker run reference(Docker 실행 참고자료)를 참조하세요. :type shm_size: str :p aram resume_from: 실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: 실행에 허용되는 최대 시간입니다. Azure ML은 자동으로 시도합니다.
이 값보다 오래 걸리면 실행을 취소합니다.
- 상속
-
azureml.train.estimator._mml_base_estimator.MMLBaseEstimatorEstimator
생성자
Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
매개 변수
Name | Description |
---|---|
source_directory
필수
|
학습 작업에 필요한 실험 구성 및 코드 파일이 포함된 로컬 디렉터리입니다. |
compute_target
필수
|
학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다. |
vm_size
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기. |
vm_priority
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다. 지원되는 값: ‘dedicated’ 및 ‘lowpriority’.
|
entry_script
필수
|
학습을 시작하는 데 사용되는 파일의 상대 경로입니다. |
script_params
필수
|
|
node_count
필수
|
학습에 사용되는 컴퓨팅 대상의 노드 수입니다. 1보다 크면 MPI 분산 작업이 실행됩니다. |
process_count_per_node
필수
|
각 노드에서 실행할 프로세스(“작업자”)의 수입니다. 1보다 크면 MPI 분산 작업이 실행됩니다. 분산 작업에는 AmlCompute 대상만 지원됩니다. |
distributed_backend
필수
|
분산 학습을 위한 통신 백 엔드입니다. 사용되지 않습니다.
지원되는 값: ‘mpi’. ‘mpi’는 MPI/Horovod를 나타냅니다. 이 매개 변수는
|
distributed_training
필수
|
분산 학습 작업을 실행하기 위한 매개 변수입니다. MPI 백 엔드로 분산 작업을 실행하려면 Mpi 개체를 사용하여 |
use_gpu
필수
|
실험을 실행할 환경이 GPU를 지원해야 하는지 여부를 나타냅니다.
true인 경우 환경에서 GPU 기반 기본 Docker 이미지가 사용됩니다. false인 경우 CPU 기반 이미지가 사용됩니다. 기본 Docker 이미지(CPU 또는 GPU)는 |
use_docker
필수
|
실험을 실행할 환경이 Docker 기반이어야 하는지 여부를 지정합니다. |
custom_docker_base_image
필수
|
학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 사용되지 않습니다.
설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. |
custom_docker_image
필수
|
학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. 공용 docker 리포지토리(Docker Hub)에서 사용할 수 있는 이미지만 지정합니다. 프라이빗 Docker 리포지토리의 이미지를 사용하려면 생성자의 |
image_registry_details
필수
|
Docker 이미지 레지스트리의 세부 정보입니다. |
user_managed
필수
|
Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. false인 경우 conda 종속성 사양을 기반으로 Python 환경이 만들어집니다. |
conda_packages
필수
|
실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다. |
pip_packages
필수
|
실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다. |
conda_dependencies_file_path
필수
|
conda 종속성 yaml 파일의 상대 경로입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. 사용되지 않습니다.
|
pip_requirements_file_path
필수
|
pip 요구 사항 텍스트 파일의 상대 경로입니다. 사용되지 않습니다.
이 매개 변수는 |
conda_dependencies_file
필수
|
conda 종속성 yaml 파일의 상대 경로입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. |
pip_requirements_file
필수
|
pip 요구 사항 텍스트 파일의 상대 경로입니다.
이 매개 변수는 |
environment_variables
필수
|
환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다. |
environment_definition
필수
|
실험에 대한 환경 정의입니다. 여기에는 PythonSection, DockerSection 및 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 이 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 |
inputs
필수
|
입력으로 사용할 DataReference 또는 DatasetConsumptionConfig 개체의 목록입니다. |
source_directory_data_store
필수
|
프로젝트 공유에 대한 백업 데이터 저장소입니다. |
shm_size
필수
|
Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본 azureml.core.environment._DEFAULT_SHM_SIZE가 사용됩니다. 자세한 내용은 Docker 실행 참조를 참조하세요. |
resume_from
필수
|
실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다. |
max_run_duration_seconds
필수
|
실행에 허용되는 최대 시간입니다. Azure ML은 이 값보다 오래 걸리는 경우 실행을 자동으로 취소하려고 시도합니다. |
source_directory
필수
|
학습 작업에 필요한 실험 구성 및 코드 파일이 포함된 로컬 디렉터리입니다. |
compute_target
필수
|
학습이 수행될 컴퓨팅 대상입니다. 이는 개체이거나 "local" 문자열일 수 있습니다. |
vm_size
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기. |
vm_priority
필수
|
학습을 위해 만들어질 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 ‘dedicated’가 사용됩니다. 지원되는 값: ‘dedicated’ 및 ‘lowpriority’.
|
entry_script
필수
|
학습을 시작하는 데 사용되는 파일의 상대 경로입니다. |
script_params
필수
|
|
node_count
필수
|
학습에 사용되는 컴퓨팅 대상의 노드 수입니다. 1보다 큰 경우 MPI 분산 작업이 실행됩니다. 분산 작업에는 AmlCompute 대상만 지원됩니다. |
process_count_per_node
필수
|
노드당 프로세스 수입니다. 1보다 큰 경우 MPI 분산 작업이 실행됩니다. 분산 작업에는 AmlCompute 대상만 지원됩니다. |
distributed_backend
필수
|
분산 학습을 위한 통신 백 엔드입니다. 사용되지 않습니다.
지원되는 값: ‘mpi’. ‘mpi’는 MPI/Horovod를 나타냅니다. 이 매개 변수는
|
distributed_training
필수
|
분산 학습 작업을 실행하기 위한 매개 변수입니다. MPI 백 엔드로 분산 작업을 실행하려면 Mpi 개체를 사용하여 |
use_gpu
필수
|
실험을 실행할 환경에서 GPU를 지원해야 하는지 여부를 지정합니다.
true인 경우 환경에서 GPU 기반 기본 Docker 이미지가 사용됩니다. false인 경우 CPU 기반 이미지가 사용됩니다. 기본 Docker 이미지(CPU 또는 GPU)는 |
use_docker
필수
|
실험을 실행할 환경이 Docker 기반이어야 하는지 여부를 지정합니다. |
custom_docker_base_image
필수
|
학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 사용되지 않습니다.
설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. |
custom_docker_image
필수
|
학습에 사용할 이미지가 빌드될 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다. 공용 docker 리포지토리(Docker Hub)에서 사용할 수 있는 이미지만 지정합니다. 프라이빗 Docker 리포지토리의 이미지를 사용하려면 생성자의 |
image_registry_details
필수
|
Docker 이미지 레지스트리의 세부 정보입니다. |
user_managed
필수
|
Azure ML이 기존 Python 환경을 다시 사용하는지 여부를 지정합니다. false인 경우 conda 종속성 사양을 기반으로 Python 환경이 만들어집니다. |
conda_packages
필수
|
실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다. |
pip_packages
필수
|
실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다. |
conda_dependencies_file_path
필수
|
conda 종속성 yaml 파일의 상대 경로입니다. 이 값을 지정하면 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. 사용되지 않습니다.
|
pip_requirements_file_path
필수
|
pip 요구 사항 텍스트 파일의 상대 경로입니다. 사용되지 않습니다.
이 경로는 |
pip_requirements_file
필수
|
pip 요구 사항 텍스트 파일의 상대 경로입니다.
|
environment_variables
필수
|
환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다. |
environment_definition
필수
|
실험에 대한 환경 정의입니다. 여기에는 PythonSection, DockerSection 및 환경 변수가 포함됩니다. 다른 매개 변수를 통해 예측 도구 구성에 직접 노출되지 않는 환경 옵션은 이 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 |
inputs
필수
|
입력으로 사용할 DataReference 또는 DatasetConsumptionConfig 개체의 목록입니다. |
source_directory_data_store
필수
|
프로젝트 공유에 대한 백업 데이터 저장소입니다. |
shm_size
필수
|
Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본값입니다. |
_disable_validation
필수
|
제출을 실행하기 전에 스크립트 유효성 검사를 사용하지 않도록 설정합니다. 기본값은 true입니다. |
_show_lint_warnings
필수
|
스크립트 린팅 경고를 표시합니다. 기본값은 False입니다. |
_show_package_warnings
필수
|
패키지 유효성 검사 경고를 표시합니다. 기본값은 False입니다. |