소개
기계 학습에서 모델은 학습 데이터에 있는 알려진 레이블과 기능 간의 상관관계를 기반으로 하여 새 데이터에 대한 알 수 없는 레이블을 예측하도록 학습됩니다. 사용된 알고리즘에 따라 모델 학습 방법을 구성하는 하이퍼 매개 변수를 지정해야 할 수 있습니다.
예를 들어 로지스틱 회귀 알고리즘은 정규화 비율 하이퍼 매개 변수를 사용하여 과잉 맞춤에 대응합니다. CNN(나선형 신경망)에 대한 딥 러닝 기술은 학습 속도와 같은 하이퍼 매개 변수를 사용하여 학습 중에 가중치를 조정하는 방법을 제어하고 일괄 처리 크기를 사용하여 각 학습 일괄 처리에 포함되는 데이터 항목 수를 결정합니다.
참고
Machine Learning은 고유한 특정 용어가 있는 교육용 필드입니다. 데이터 과학자는 학습 기능에서 결정된 값을 매개 변수로 참조하므로 학습 동작을 구성하는 데 사용되는 값에는 다른 용어가 필요하지만 학습 데이터에서 파생되지 않습니다. 따라서 이 용어는 hyperparameter입니다.
하이퍼 매개 변수 값을 선택하면 결과 모델에 상당한 영향을 줄 수 있으므로 특정 데이터 및 예측 성과 목표에 대한 최적의 값을 선택하는 것이 중요합니다.
하이퍼 매개 변수 튜닝
하이퍼 매개 변수 튜닝은 동일한 알고리즘 및 학습 데이터를 사용하지만 하이퍼 매개 변수 값이 서로 다른 여러 모델을 학습하여 수행됩니다. 그런 다음 각 학습 실행의 결과 모델을 평가하여 최적화하려는 성능 메트릭(예: 정확도)을 결정하면 가장 적합한 모델이 선택됩니다.
Azure Machine Learning에서 스윕 작업을 스크립트로 제출하여 하이퍼 매개 변수를 튜닝할 수 있습니다. 스윕 작업은 테스트할 각 하이퍼 매개 변수 조합에 대해 평가판을 실행합니다. 각 체험판은 매개 변수화된 하이퍼 매개 변수 값과 함께 학습 스크립트를 사용하여 모델을 학습하고 학습된 모델에서 얻은 대상 성능 메트릭을 기록합니다.
학습 목표
이 모듈에서는 다음을 수행하는 방법을 알아봅니다.
- 하이퍼 매개 변수 검색 공간을 정의합니다.
- 하이퍼 매개 변수 샘플링을 구성합니다.
- 초기 종료 정책을 선택합니다.
- 스윕 작업을 실행합니다.