다음을 통해 공유


Machine Learning - 학습

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

이 문서에서는 기계 학습 모델을 학습하기 위해 Machine Learning Studio(클래식)에서 제공하는 모듈에 대해 설명합니다. 학습 은 미리 정의된 모델의 매개 변수를 사용하여 입력 데이터를 분석하는 프로세스입니다. 이 분석에서 모델은 패턴을 학습하고 학습된 모델의 형태로 저장합니다.

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

이 문서에서는 모델 생성, 학습, 평가 및 점수 매기기를 위한 Machine Learning Studio(클래식)의 전체 프로세스에 대해서도 설명합니다.

기계 학습 모델 만들기 및 사용

기계 학습에 대한 일반적인 워크플로에는 다음 단계가 포함됩니다.

  • 적합한 알고리즘을 선택하고 초기 옵션을 설정합니다.
  • 호환되는 데이터에 대한 모델 학습
  • 모델의 패턴에 따라 새 데이터를 사용하여 예측을 만듭니다.
  • 모델을 평가하여 예측이 정확한지, 얼마나 많은 오류가 있는지, 과잉 맞춤이 있는지 확인합니다.

Machine Learning Studio(클래식)는 기계 학습을 위한 유연하고 사용자 지정 가능한 프레임워크를 지원합니다. 이 프로세스의 각 작업은 실험의 나머지 부분을 중단하지 않고 수정, 추가 또는 제거할 수 있는 특정 유형의 모듈에 의해 수행됩니다.

이 범주의 모듈은 다양한 유형의 모델에 대한 학습을 지원합니다. 학습하는 동안 데이터는 기계 학습 알고리즘에 의해 분석됩니다. 이 알고리즘은 데이터의 분포 및 형식을 분석하고, 통계를 컴파일하고, 나중에 예측에 사용할 수 있는 패턴을 만듭니다.

모델 학습에 대한 자세한 정보

Machine Learning 모델을 학습하는 경우 값이 누락된 행은 건너뜁니다. 따라서 값을 수동으로 수정하거나, 대체를 사용하거나, 누락된 값을 처리하는 다른 방법을 지정하려면 데이터 세트에 대해 학습하기 전에 누락된 데이터 정리 모듈을 사용합니다.

메타데이터 편집 모듈을 사용하여 데이터와 관련된 다른 문제를 해결하는 것이 좋습니다. 레이블 열을 표시하거나, 데이터 형식을 변경하거나, 열 이름을 수정해야 할 수 있습니다.

정규화, 샘플링, 범주화 및 크기 조정과 같은 다른 일반적인 데이터 정리 작업은 데이터 변환 범주를 참조하세요.

올바른 트레이너 선택

모델을 학습하는 데 사용하는 메서드는 만드는 모델의 유형과 모델에 필요한 데이터 형식에 따라 달라집니다. 예를 들어 Machine Learning 변칙 검색 모델, 권장 사항 모델 등을 학습하기 위한 모듈을 제공합니다.

학습 모듈 목록을 확인하여 시나리오에 적합한 모듈을 확인합니다.

모델을 학습할 때 사용할 최상의 매개 변수를 잘 모르는 경우 매개 변수 비우기 및 유효성 검사에 제공된 모듈 중 하나를 사용합니다.

  • 모델 튜닝 하이퍼 매개 변수는 거의 모든 분류 및 회귀 모델에서 매개 변수 스윕을 수행할 수 있습니다. 여러 모델을 학습한 다음 최상의 모델을 반환합니다.

  • 스윕 클러스터링 모듈은 학습 프로세스 중에 모델 튜닝을 지원하며 클러스터링 모델에서만 사용하기 위한 것입니다. 가장 적합한 매개 변수를 자동으로 검색하면서 원심의 범위를 지정하고 데이터를 학습할 수 있습니다.

  • 모델 교차 유효성 검사 모듈은 모델 최적화에도 유용하지만 학습된 모델을 반환하지는 않습니다. 대신 최상의 모델을 결정하는 데 사용할 수 있는 메트릭을 제공합니다.

모델 다시 학습

프로덕션 모델을 다시 학습해야 하는 경우 언제든지 실험을 다시 실행할 수 있습니다.

웹 서비스를 사용하여 재학습 프로세스를 자동화할 수도 있습니다. 연습은 Azure Data Factory 사용하여 Machine Learning 모델 재학습 및 업데이트를 참조하세요.

미리 학습된 모델 사용

Machine Learning 미리 학습된 Cascade 이미지 분류 모듈과 같이 미리 학습된 일부 모델을 포함합니다. 이러한 모델을 추가 데이터 입력 없이 채점에 사용할 수 있습니다.

또한 일부 모듈(예: 시계열 변칙 검색)은 iLearner 형식으로 학습된 모델을 생성하지 않습니다. 그러나 학습 데이터를 가져와 내부적으로 모델을 만든 다음 예측을 수행하는 데 사용할 수 있습니다. 이러한 매개 변수를 사용하려면 매개 변수를 구성하고 데이터를 제공합니다.

학습된 모델의 스냅샷 저장

모델을 저장하거나 내보내려면 학습 모듈을 마우스 오른쪽 단추 로 클릭하고 학습된 모델로 저장을 선택합니다. 모델은 iLearner 형식으로 내보내지고 학습된 모델 아래에 작업 영역에 저장됩니다. 학습된 모델은 다른 실험에서 다시 사용하거나 채점을 위해 다른 모듈에 연결할 수 있습니다.

실험에서 학습된 모델 로드 모듈을 사용하여 저장된 모델을 검색할 수도 있습니다.

모듈 목록

학습 범주에는 다음 모듈이 포함됩니다.

  • 스윕 클러스터링: 클러스터링 모델에서 매개 변수 스윕을 수행하여 최적의 매개 변수 설정을 확인하고 최상의 모델을 학습합니다.
  • 변칙 검색 모델 학습: 변칙 탐지기 모델을 학습시키고 학습 집합에서 데이터에 레이블을 지정합니다.
  • 클러스터링 모델 학습: 클러스터링 모델을 학습시키고 학습 집합의 데이터를 클러스터에 할당합니다.
  • 매치박스 추천 학습: 매치박스 알고리즘을 사용하여 Bayesian 추천자를 학습시킵니다.
  • 모델 학습: 학습 집합에서 분류 또는 회귀 모델을 학습합니다.
  • 모델 하이퍼 매개 변수 조정: 회귀 또는 분류 모델에서 매개 변수 스윕을 수행하여 최적의 매개 변수 설정을 확인하고 최상의 모델을 학습합니다.

일부 모듈은 특수한 형식이 필요하거나 특정 작업에 맞게 사용자 지정되므로 이 범주에 속하지 않습니다.

참고 항목