automl 패키지
Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다.
주요 영역에는 AutoML 작업 관리가 포함됩니다.
클래스
ClassificationJob |
AutoML 분류 작업에 대한 구성입니다. 새 AutoML 분류 작업을 초기화합니다. |
ColumnTransformer |
열 변환기 설정. |
ForecastingJob |
AutoML 예측 작업에 대한 구성입니다. 새 AutoML 예측 작업을 초기화합니다. |
ForecastingSettings |
AutoML 작업에 대한 예측 설정입니다. |
ImageClassificationJob |
AutoML 다중 클래스 이미지 분류 작업에 대한 구성입니다. 새 AutoML 다중 클래스 이미지 분류 작업을 초기화합니다. |
ImageClassificationMultilabelJob |
AutoML 다중 레이블 이미지 분류 작업에 대한 구성입니다. 새 AutoML 다중 레이블 이미지 분류 작업을 초기화합니다. |
ImageClassificationSearchSpace |
AutoML 이미지 분류 및 이미지 분류 다중 레이블 작업에 대한 검색 공간입니다. |
ImageInstanceSegmentationJob |
AutoML 이미지 인스턴스 구분 작업에 대한 구성입니다. 새 AutoML 이미지 인스턴스 구분 작업을 초기화합니다. |
ImageLimitSettings |
AutoML 이미지 세로에 대한 설정을 제한합니다. ImageLimitSettings는 max_concurrent_trials, max_trials 및 timeout_minutes 매개 변수를 포함하는 클래스입니다. 제한 매개 변수(예: 시간 제한 등)를 구성하는 선택적 구성 방법입니다. 참고 동시 실행 수는 지정된 컴퓨팅 대상에서 사용할 수 있는 리소스에서 제어됩니다. 원하는 동시성에 사용할 수 있는 리소스가 컴퓨팅 대상에 있는지 확인합니다. 팁 max_concurrent_trials 개수를 클러스터의 노드 수와 일치시킬 수 있습니다. 예를 들어 노드가 4개인 클러스터가 있는 경우 max_concurrent_trials 4로 설정합니다. 사용 예 ImageLimitSettings 구성
ImageLimitSettings 개체를 초기화합니다. AutoML 이미지 세로에 대한 ImageLimitSettings 생성자입니다. |
ImageModelSettingsClassification |
AutoML 이미지 분류 작업에 대한 모델 설정입니다. |
ImageModelSettingsObjectDetection |
AutoML 이미지 개체 감지 태스크에 대한 모델 설정입니다. |
ImageObjectDetectionJob |
AutoML 이미지 개체 검색 작업에 대한 구성입니다. 새 AutoML 이미지 개체 검색 작업을 초기화합니다. |
ImageObjectDetectionSearchSpace |
AutoML 이미지 개체 감지 및 이미지 인스턴스 구분 작업을 위한 검색 공간입니다. |
ImageSweepSettings |
모든 AutoML 이미지 세로에 대한 스윕 설정입니다. |
NlpFeaturizationSettings |
모든 AutoML NLP 세로에 대한 기능화 설정입니다. |
NlpFixedParameters |
NLP 작업에 대한 고정 매개 변수를 수용하는 개체입니다. |
NlpLimitSettings |
모든 AutoML NLP 세로에 대한 설정을 제한합니다. |
NlpSearchSpace |
AutoML NLP 작업에 대한 검색 공간입니다. |
NlpSweepSettings |
모든 AutoML NLP 작업에 대한 스윕 설정입니다. |
RegressionJob |
AutoML 회귀 작업에 대한 구성입니다. 새 AutoML 회귀 작업을 초기화합니다. |
SearchSpace |
AutoML 세로에 대한 SearchSpace 클래스입니다. |
StackEnsembleSettings |
StackEnsemble 실행을 사용자 지정하기 위한 사전 설정입니다. |
TabularFeaturizationSettings |
AutoML 작업에 대한 기능화 설정입니다. |
TabularLimitSettings |
AutoML 테이블 세로에 대한 설정을 제한합니다. |
TextClassificationJob |
AutoML 텍스트 분류 작업에 대한 구성입니다. 새 AutoML 텍스트 분류 작업을 초기화합니다. |
TextClassificationMultilabelJob |
AutoML 텍스트 분류 다중 레이블 작업에 대한 구성입니다. 새 AutoML 텍스트 분류 다중 레이블 작업을 초기화합니다. |
TextNerJob |
AutoML 텍스트 NER 작업에 대한 구성입니다. 새 AutoML 텍스트 NER 작업을 초기화합니다. |
TrainingSettings |
Azure Machine Learning에 대한 TrainingSettings 클래스입니다. Azure Machine Learning에 대한 TrainingSettings 클래스입니다. |
열거형
BlockedTransformers |
AutoML에서 지원하는 모든 분류 모델에 대한 열거형입니다. |
ClassificationModels |
AutoML에서 지원하는 모든 분류 모델에 대한 열거형입니다. |
ClassificationMultilabelPrimaryMetrics |
분류 다중 레이블 작업에 대한 기본 메트릭입니다. |
ClassificationPrimaryMetrics |
분류 작업에 대한 기본 메트릭입니다. |
FeaturizationMode |
기능화 모드 - 데이터 기능화 모드를 결정합니다. |
ForecastHorizonMode |
예측 수평선 선택 모드를 결정하는 열거형입니다. |
ForecastingModels |
AutoML에서 지원하는 모든 예측 모델에 대한 열거형입니다. |
ForecastingPrimaryMetrics |
예측 작업에 대한 기본 메트릭입니다. |
InstanceSegmentationPrimaryMetrics |
InstanceSegmentation 작업에 대한 기본 메트릭입니다. |
LearningRateScheduler |
학습 속도 스케줄러 열거형. |
LogTrainingMetrics |
Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다. 주요 영역에는 AutoML 작업 관리가 포함됩니다. |
LogValidationLoss |
Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다. 주요 영역에는 AutoML 작업 관리가 포함됩니다. |
NCrossValidationsMode |
N 교차 유효성 검사 값이 결정되는 방법을 결정합니다. |
ObjectDetectionPrimaryMetrics |
Image ObjectDetection 작업에 대한 기본 메트릭입니다. |
RegressionModels |
AutoML에서 지원하는 모든 회귀 모델에 대한 열거형입니다. |
RegressionPrimaryMetrics |
회귀 작업에 대한 기본 메트릭입니다. |
SamplingAlgorithmType |
Azure Machine Learning SDKv2에 대한 자동화된 기계 학습 클래스를 포함합니다. 주요 영역에는 AutoML 작업 관리가 포함됩니다. |
ShortSeriesHandlingConfiguration |
AutoML이 짧은 시계열을 처리해야 하는지 여부를 정의하는 매개 변수입니다. |
StochasticOptimizer |
이미지 모델에 대한 확률적 최적화 프로그램입니다. |
TargetAggregationFunction |
대상 집계 함수입니다. |
TargetLagsMode |
대상은 선택 모드를 지연합니다. |
TargetRollingWindowSizeMode |
대상 롤링 창 크기 모드입니다. |
UseStl |
시계열 대상 열의 STL 분해를 구성합니다. |
ValidationMetricType |
이미지 작업의 유효성 검사 메트릭에 사용할 메트릭 계산 방법입니다. |
함수
classification
ClassificationJob을 만드는 함수입니다.
분류 작업은 데이터 샘플의 클래스를 가장 잘 예측하는 모델을 학습시키는 데 사용됩니다. 다양한 모델은 학습 데이터를 사용하여 학습됩니다. 기본 메트릭을 기반으로 하는 유효성 검사 데이터에서 최상의 성능을 가진 모델이 최종 모델로 선택됩니다.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.
- target_column_name
- str
레이블 열의 이름입니다.
이 매개 변수는 , validation_data
및 test_data
매개 변수에 적용할 training_data
수 있습니다.
- primary_metric
자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.
허용되는 값: 정확도, AUC_weighted, norm_macro_recall, average_precision_score_weighted 및 precision_score_weighted 정확도로 기본값
- enable_model_explainability
- bool
모든 AutoML 학습 반복이 끝날 때 최상의 AutoML 모델을 설명할 수 있는지 여부입니다. 기본값은 None입니다. 자세한 내용은 해석 가능성: 자동화된 Machine Learning의 모델 설명을 참조하세요.
- weight_column_name
- str
샘플 가중치 열의 이름입니다. 자동화된 ML은 가중치 열을 입력으로 지원하여 데이터 행의 가중치를 높이거나 낮춥니다. 입력 데이터를 열 이름이 없는 pandas.DataFrame에서 가져온 경우 정수로 표시되는 열 인덱스를 대신 사용할 수 있습니다.
이 매개 변수는 및 validation_data
매개 변수에 training_data
적용할 수 있습니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.
기본값: 없음
- validation_data_size
- float
사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.
유효성 검사 데이터를 제공하려면 validation_data
를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations
또는 validation_data_size
를 설정합니다.
사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names
를 사용합니다.
자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.
기본값: 없음
사용자 유효성 검사 데이터를 지정하지 않은 경우 수행할 교차 유효성 검사의 수입니다.
유효성 검사 데이터를 제공하려면 validation_data
를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations
또는 validation_data_size
를 설정합니다.
사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names
를 사용합니다.
자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.
기본값은 없음입니다.
사용자 지정 교차 유효성 검사 분할이 포함된 열의 이름 목록입니다. 각 CV 분할 열은 각 행이 학습용인 경우 1로 표시되고 유효성 검사용인 경우 0으로 표시된 하나의 CV 분할을 나타냅니다.
기본값은 없음입니다.
- test_data
- Input
테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 사용할 테스트 데이터입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.
이 매개 변수 또는 test_data_size
매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.
테스트 데이터에는 기능과 레이블 열이 모두 포함되어야 합니다.
test_data
가 지정되면 target_column_name
매개 변수도 지정해야 합니다.
기본값은 없음입니다.
- test_data_size
- float
테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 대한 테스트 데이터에 대해 보류할 학습 데이터의 비율입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.
이 값은 0.0에서 1.0 사이여야 합니다.
test_data_size
가 validation_data_size
와 동시에 지정된 경우 유효성 검사 데이터가 분할되기 전에 테스트 데이터가 training_data
에서 분할됩니다.
예를 들어 validation_data_size=0.1
이고 test_data_size=0.1
이며 원래 학습 데이터에 1,000개의 행이 있는 경우 테스트 데이터에는 100개의 행이 있고 유효성 검사 데이터에는 90개의 행이 포함되며 학습 데이터에는 810개의 행이 포함됩니다.
회귀 기반 작업의 경우 무작위 샘플링이 사용됩니다. 분류 작업의 경우 계층화된 샘플링이 사용됩니다. 예측은 현재 학습/테스트 분할을 사용하여 테스트 데이터 세트를 지정하는 것을 지원하지 않습니다.
이 매개 변수 또는 test_data
매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.
기본값은 없음입니다.
반환
실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 작업 개체입니다.
반환 형식
forecasting
예측 작업을 만드는 함수입니다.
예측 작업은 기록 데이터를 기반으로 향후 기간의 대상 값을 예측하는 데 사용됩니다. 다양한 모델은 학습 데이터를 사용하여 학습됩니다. 기본 메트릭을 기반으로 하는 유효성 검사 데이터에서 최상의 성능을 가진 모델이 최종 모델로 선택됩니다.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.
- target_column_name
- str
레이블 열의 이름입니다.
이 매개 변수는 , validation_data
및 test_data
매개 변수에 training_data
적용할 수 있습니다.
- primary_metric
자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.
허용되는 값: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error 기본값을 normalized_root_mean_squared_error
- enable_model_explainability
- bool
모든 AutoML 학습 반복이 끝날 때 최상의 AutoML 모델을 설명할 수 있는지 여부입니다. 기본값은 None입니다. 자세한 내용은 해석 가능성: 자동화된 Machine Learning의 모델 설명을 참조하세요.
- weight_column_name
- str
샘플 가중치 열의 이름입니다. 자동화된 ML은 가중치 열을 입력으로 지원하여 데이터 행의 가중치를 높이거나 낮춥니다. 입력 데이터를 열 이름이 없는 pandas.DataFrame에서 가져온 경우 정수로 표시되는 열 인덱스를 대신 사용할 수 있습니다.
이 매개 변수는 및 validation_data
매개 변수에 training_data
적용할 수 있습니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.
기본값은 없음입니다.
- validation_data_size
- float
사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.
유효성 검사 데이터를 제공하려면 validation_data
를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations
또는 validation_data_size
를 설정합니다.
사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names
를 사용합니다.
자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.
기본값은 없음입니다.
사용자 유효성 검사 데이터를 지정하지 않은 경우 수행할 교차 유효성 검사의 수입니다.
유효성 검사 데이터를 제공하려면 validation_data
를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations
또는 validation_data_size
를 설정합니다.
사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names
를 사용합니다.
자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.
기본값은 없음입니다.
사용자 지정 교차 유효성 검사 분할이 포함된 열의 이름 목록입니다. 각 CV 분할 열은 각 행이 학습용인 경우 1로 표시되고 유효성 검사용인 경우 0으로 표시된 하나의 CV 분할을 나타냅니다.
기본값은 없음입니다.
- test_data
- Input
테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 사용할 테스트 데이터입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.
이 매개 변수 또는 test_data_size
매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.
테스트 데이터에는 기능과 레이블 열이 모두 포함되어야 합니다.
test_data
가 지정되면 target_column_name
매개 변수도 지정해야 합니다.
기본값은 없음입니다.
- test_data_size
- float
테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 대한 테스트 데이터에 대해 보류할 학습 데이터의 비율입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.
이 값은 0.0에서 1.0 사이여야 합니다.
test_data_size
가 validation_data_size
와 동시에 지정된 경우 유효성 검사 데이터가 분할되기 전에 테스트 데이터가 training_data
에서 분할됩니다.
예를 들어 validation_data_size=0.1
이고 test_data_size=0.1
이며 원래 학습 데이터에 1,000개의 행이 있는 경우 테스트 데이터에는 100개의 행이 있고 유효성 검사 데이터에는 90개의 행이 포함되며 학습 데이터에는 810개의 행이 포함됩니다.
회귀 기반 작업의 경우 무작위 샘플링이 사용됩니다. 분류 작업의 경우 계층화된 샘플링이 사용됩니다. 예측은 현재 학습/테스트 분할을 사용하여 테스트 데이터 세트를 지정하는 것을 지원하지 않습니다.
이 매개 변수 또는 test_data
매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.
기본값은 없음입니다.
- forecasting_settings
- ForecastingSettings
예측 작업에 대한 설정
반환
실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 작업 개체입니다.
반환 형식
image_classification
AutoML 이미지 다중 클래스 분류 작업에 대한 개체를 만듭니다.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다.
- target_column_name
- str
레이블 열의 이름입니다.
이 매개 변수는 training_data
및 validation_data
매개 변수에 적용할 수 있습니다.
- primary_metric
자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.
허용되는 값: 정확도, AUC_weighted, norm_macro_recall, average_precision_score_weighted 및 precision_score_weighted 기본값을 정확도로 설정합니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다.
- validation_data_size
- float
사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.
유효성 검사 데이터를 제공하려면 를 지정 validation_data
하고, 그렇지 않으면 지정된 학습 데이터에서 유효성 검사 데이터를 추출하도록 설정합니다 validation_data_size
.
기본값은 .2입니다.
- kwargs
- dict
추가 구성 매개 변수의 사전입니다.
반환
실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 이미지 분류 작업 개체입니다.
반환 형식
image_classification_multilabel
AutoML 이미지 다중 레이블 분류 작업에 대한 개체를 만듭니다.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다.
- target_column_name
- str
레이블 열의 이름입니다.
이 매개 변수는 training_data
및 validation_data
매개 변수에 적용할 수 있습니다.
- primary_metric
자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.
허용되는 값: 정확도, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted 및 Iou 기본값은 Iou입니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다.
- validation_data_size
- float
사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.
유효성 검사 데이터를 제공하려면 를 지정 validation_data
하고, 그렇지 않으면 를 설정 validation_data_size
하여 지정된 학습 데이터에서 유효성 검사 데이터를 추출합니다.
기본값은 .2입니다.
- kwargs
- dict
추가 구성 매개 변수의 사전입니다.
반환
실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 다중 레이블 분류 작업 개체를 이미지로 표시합니다.
반환 형식
image_instance_segmentation
AutoML 이미지 인스턴스 구분 작업에 대한 개체를 만듭니다.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다.
- target_column_name
- str
레이블 열의 이름입니다.
이 매개 변수는 training_data
및 validation_data
매개 변수에 적용할 수 있습니다.
- primary_metric
자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.
허용되는 값: MeanAveragePrecision 기본값은 MeanAveragePrecision입니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다.
- validation_data_size
- float
사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.
유효성 검사 데이터를 제공하려면 를 지정 validation_data
하고, 그렇지 않으면 를 설정 validation_data_size
하여 지정된 학습 데이터에서 유효성 검사 데이터를 추출합니다.
기본값은 .2입니다.
- kwargs
- dict
추가 구성 매개 변수의 사전입니다.
반환
이미지 instance 구분 작업
반환 형식
image_object_detection
AutoML 이미지 개체 감지 작업에 대한 개체를 만듭니다.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다.
- target_column_name
- str
레이블 열의 이름입니다.
이 매개 변수는 training_data
및 validation_data
매개 변수에 적용할 수 있습니다.
- primary_metric
자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.
허용되는 값: MeanAveragePrecision 기본값은 MeanAveragePrecision입니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다.
- validation_data_size
- float
사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.
유효성 검사 데이터를 제공하려면 를 지정 validation_data
하고, 그렇지 않으면 를 설정 validation_data_size
하여 지정된 학습 데이터에서 유효성 검사 데이터를 추출합니다.
기본값은 .2입니다.
- kwargs
- dict
추가 구성 매개 변수의 사전입니다.
반환
실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 이미지 개체 검색 작업 개체입니다.
반환 형식
regression
회귀 작업을 만드는 함수입니다.
회귀 작업은 데이터 세트에서 대상 변수의 연속 값을 예측하는 모델을 학습시키는 데 사용됩니다. 다양한 모델은 학습 데이터를 사용하여 학습됩니다. 기본 메트릭을 기반으로 유효성 검사 데이터에서 최상의 성능을 가진 모델이 최종 모델로 선택됩니다.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.
- target_column_name
- str
레이블 열의 이름입니다.
이 매개 변수는 , validation_data
및 test_data
매개 변수에 적용할 training_data
수 있습니다.
- primary_metric
자동화된 Machine Learning이 모델 선택에 최적화되는 메트릭입니다. 자동화된 Machine Learning은 최적화할 수 있는 것보다 더 많은 메트릭을 수집합니다. 메트릭을 계산하는 방법에 대한 자세한 내용은 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric을 참조하세요.
허용되는 값: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. 기본값은 normalized_root_mean_squared_error
- enable_model_explainability
- bool
모든 AutoML 학습 반복이 끝날 때 최상의 AutoML 모델을 설명할 수 있는지 여부입니다. 기본값은 None입니다. 자세한 내용은 해석 가능성: 자동화된 Machine Learning의 모델 설명을 참조하세요.
- weight_column_name
- str
샘플 가중치 열의 이름입니다. 자동화된 ML은 가중치 열을 입력으로 지원하여 데이터 행의 가중치를 높이거나 낮춥니다. 입력 데이터를 열 이름이 없는 pandas.DataFrame에서 가져온 경우 정수로 표시되는 열 인덱스를 대신 사용할 수 있습니다.
이 매개 변수는 및 validation_data
매개 변수에 training_data
적용할 수 있습니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다. 여기에는 학습 기능과 레이블 열(선택적으로 샘플 가중치 열)이 모두 포함되어야 합니다.
기본값: 없음
- validation_data_size
- float
사용자 유효성 검사 데이터가 지정되지 않은 경우 유효성 검사를 위해 유지할 데이터의 소수입니다. 이 값은 0.0에서 1.0 사이여야 합니다.
유효성 검사 데이터를 제공하려면 validation_data
를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations
또는 validation_data_size
를 설정합니다.
사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names
를 사용합니다.
자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.
기본값: 없음
사용자 유효성 검사 데이터를 지정하지 않은 경우 수행할 교차 유효성 검사의 수입니다.
유효성 검사 데이터를 제공하려면 validation_data
를 지정하고, 지정된 학습 데이터에서 유효성 검사 데이터를 추출하려면 n_cross_validations
또는 validation_data_size
를 설정합니다.
사용자 지정 교차 유효성 검사 폴드의 경우 cv_split_column_names
를 사용합니다.
자세한 내용은 자동화된 Machine Learning에서 데이터 분할 및 교차 유효성 검사 구성을 참조하세요.
기본값: 없음
사용자 지정 교차 유효성 검사 분할이 포함된 열의 이름 목록입니다. 각 CV 분할 열은 각 행이 학습용인 경우 1로 표시되고 유효성 검사용인 경우 0으로 표시된 하나의 CV 분할을 나타냅니다.
기본값: 없음
- test_data
- Input
테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 사용할 테스트 데이터입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.
이 매개 변수 또는 test_data_size
매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.
테스트 데이터에는 기능과 레이블 열이 모두 포함되어야 합니다.
test_data
가 지정되면 target_column_name
매개 변수도 지정해야 합니다.
기본값: 없음
- test_data_size
- float
테스트 데이터 세트 또는 테스트 데이터 분할을 사용하는 모델 테스트 기능은 미리 보기 상태의 기능이며 언제든지 변경될 수 있습니다. 모델 학습이 완료된 후 자동으로 시작되는 테스트 실행에 대한 테스트 데이터에 대해 보류할 학습 데이터의 비율입니다. 테스트 실행은 최상의 모델을 사용하여 예측을 얻고 이러한 예측이 제공된 메트릭을 컴퓨팅합니다.
이 값은 0.0에서 1.0 사이여야 합니다.
test_data_size
가 validation_data_size
와 동시에 지정된 경우 유효성 검사 데이터가 분할되기 전에 테스트 데이터가 training_data
에서 분할됩니다.
예를 들어 validation_data_size=0.1
이고 test_data_size=0.1
이며 원래 학습 데이터에 1,000개의 행이 있는 경우 테스트 데이터에는 100개의 행이 있고 유효성 검사 데이터에는 90개의 행이 포함되며 학습 데이터에는 810개의 행이 포함됩니다.
회귀 기반 작업의 경우 무작위 샘플링이 사용됩니다. 분류 작업의 경우 계층화된 샘플링이 사용됩니다. 예측은 현재 학습/테스트 분할을 사용하여 테스트 데이터 세트를 지정하는 것을 지원하지 않습니다.
이 매개 변수 또는 test_data
매개 변수를 지정하지 않으면 모델 학습이 완료된 후 테스트 실행이 자동으로 실행되지 않습니다.
기본값: 없음
반환
실행을 위해 Azure ML 컴퓨팅에 제출할 수 있는 작업 개체입니다.
반환 형식
text_classification
TextClassificationJob을 만드는 함수입니다.
텍스트 분류 작업은 텍스트 데이터의 클래스/범주를 예측할 수 있는 모델을 학습시키는 데 사용됩니다. 입력 학습 데이터에는 텍스트를 정확히 하나의 클래스로 분류하는 대상 열이 포함되어야 합니다.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.
- target_column_name
- str
대상 열의 이름입니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
작업에 대한 기본 메트릭입니다. 허용되는 값: 정확도, AUC_weighted, precision_score_weighted
- log_verbosity
- str
자세한 정보 표시 수준을 기록합니다.
- kwargs
- dict
추가 구성 매개 변수의 사전입니다.
반환
TextClassificationJob 개체입니다.
반환 형식
text_classification_multilabel
TextClassificationMultilabelJob을 만드는 함수입니다.
텍스트 분류 다중 레이블 작업은 텍스트 데이터의 클래스/범주를 예측할 수 있는 모델을 학습시키는 데 사용됩니다. 입력 학습 데이터에는 텍스트를 클래스로 분류하는 대상 열이 포함되어야 합니다. 다중 레이블 데이터 형식에 대한 자세한 내용은 다음을 참조하세요. https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.
- target_column_name
- str
대상 열의 이름입니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.
- primary_metric
- str
작업에 대한 기본 메트릭입니다. 허용되는 값: 정확도
- log_verbosity
- str
자세한 정보 표시 수준을 기록합니다.
- kwargs
- dict
추가 구성 매개 변수의 사전입니다.
반환
TextClassificationMultilabelJob 개체입니다.
반환 형식
text_ner
TextNerJob을 만드는 함수입니다.
엔터티 인식 작업이라는 텍스트는 텍스트에서 명명된 엔터티를 예측할 수 있는 모델을 학습시키는 데 사용됩니다. 입력 학습 데이터는 CoNLL 형식의 텍스트 파일이어야 합니다. 텍스트 NER 데이터 형식에 대한 자세한 내용은 다음을 참조하세요. https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
매개 변수
- training_data
- Input
실험 내에서 사용할 학습 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.
- validation_data
- Input
실험 내에서 사용할 유효성 검사 데이터입니다. 학습 기능과 대상 열을 모두 포함해야 합니다.
- primary_metric
- str
작업에 대한 기본 메트릭입니다. 허용되는 값: 정확도
- log_verbosity
- str
자세한 정보 표시 수준을 기록합니다.
- kwargs
- dict
추가 구성 매개 변수의 사전입니다.
반환
TextNerJob 개체입니다.
반환 형식
Azure SDK for Python