다음을 통해 공유


클러스터링 모델 학습

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

클러스터링 모델을 학습하고 학습 집합에서 클러스터로 데이터 할당

범주: Machine Learning/학습

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 클러스터링 모델 학습 모듈을 사용하여 클러스터링 모델을 학습하는 방법을 설명합니다.

이 모듈은 이미 K-Means Clustering 모듈을 사용하여 구성한 학습되지 않은 클러스터링 모델을 사용하며 레이블이 지정되거나 지정되지 않은 데이터 세트를 사용하여 모델을 학습합니다. 이 모듈은 예측에 사용할 수 있는 학습된 모델과 학습 데이터의 각 사례에 대한 클러스터 할당 집합을 만듭니다.

참고

기계 학습 모델을 만들기 위한 제네릭 모듈인 모델 학습 모듈을 사용하여 클러스터링 모델을 학습시킬 수 없습니다. 모델 학습은 감독된 학습 알고리즘에서만 작동하기 때문입니다. K-Means 및 다른 클러스터링 알고리즘을 사용하는 경우 자율 학습을 허용합니다. 즉, 알고리즘이 레이블이 지정되지 않은 데이터를 통해 학습할 수 있습니다.

클러스터링 모델 학습을 사용하는 방법

  1. Studio(클래식)에서 실험에 클러스터링 모델 학습 모듈을 추가합니다. 학습 범주의 기계 학습 모듈 아래에서 모듈을 찾을 수 있습니다.

  2. K-Means Clustering 모듈이나 호환되는 클러스터링 모델을 만들고 클러스터링 모델의 매개 변수를 설정하는 다른 사용자 지정 모듈을 추가합니다.

  3. 클러스터링 모델 학습의 오른쪽 입력에 학습 데이터 세트를 연결합니다.

  4. 열 집합에서 클러스터를 작성하는 데 사용할 데이터 세트의 열을 선택합니다. 올바른 기능을 제공하는 열을 선택해야 합니다. 예를 들어 ID 또는 고유한 값이 있는 다른 열을 사용하거나 모든 값이 같은 열을 사용하지 마십시오.

    레이블을 사용할 수 있는 경우 해당 레이블을 기능으로 사용하거나 그대로 둘 수 있습니다.

  5. 새 클러스터 레이블과 함께 학습 데이터를 출력하려면 [ 추가 확인] 또는 [결과만 선택 취소] 옵션을 선택합니다.

    이 옵션의 선택을 취소하면 클러스터 할당만 출력됩니다.

  6. 실험을 실행하거나 클러스터링 모델 학습 모듈을 클릭하고 선택한 실행을 선택합니다.

결과

학습을 완료한 후:

  • 그래프에서 클러스터와 해당 분리를 보려면 결과 데이터 세트 출력을 마우스 오른쪽 단추로 클릭하고 시각화를 선택합니다.

    그래프는 실제 값이 아닌 클러스터의 주 구성 요소를 나타냅니다. 자세한 내용은 주 구성 요소 분석을 참조하세요.

  • 데이터 세트의 값을 보려면 데이터 세트 로 변환 모듈의 인스턴스를 추가하고 결과 데이터 세트 출력에 연결합니다. 데이터 세트로 변환 모듈을 실행하여 보거나 다운로드할 수 있는 데이터의 복사본을 가져옵니다.

  • 나중에 다시 사용할 수 있도록 학습된 모델을 저장하려면 모듈을 마우스 오른쪽 단추로 클릭하고 학습된 모델을 선택한 다음 학습된 모델로 저장을 클릭합니다.

  • 모델에서 점수를 생성하려면 클러스터에 데이터 할당을 사용합니다.

기계 학습에서 클러스터링을 사용하는 방법의 예는 Azure AI 갤러리를 참조하세요.

예상 입력

Name 유형 설명
학습되지 않은 모델 ICluster 인터페이스 학습되지 않은 클러스터링 모델입니다.
데이터 세트 데이터 테이블 입력 데이터 원본입니다.

모듈 매개 변수

Name 범위 Type 기본값 설명
열 집합 any ColumnSelection 열 선택 패턴입니다.
추가하려면 선택/결과만 출력하려면 선택 취소 any 부울 true 출력 데이터 집합에 할당 열이 추가된 입력 데이터 집합이 포함되어야 하는지(선택) 아니면 할당 열만 포함되어야 하는지(선택 취소)를 지정합니다.

출력

Name 유형 Description
학습된 모델 ICluster 인터페이스 학습된 클러스터링 모델입니다.
결과 데이터 집합 데이터 테이블 할당의 데이터 열이 추가되거나 할당 열만 포함된 입력 데이터 집합입니다.

예외

예외 설명
오류 0003 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다.

Studio(클래식) 모듈과 관련된 오류 목록은 Machine Learning 오류 코드를 참조하세요.

API 예외 목록은 Machine Learning REST API 오류 코드를 참조하세요.

참고 항목

전체 모듈 목록
학습
클러스터에 데이터 할당
K-Means 클러스터링