클러스터링 모델 학습
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
클러스터링 모델을 학습하고 학습 집합에서 클러스터로 데이터 할당
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)에서 클러스터링 모델 학습 모듈을 사용하여 클러스터링 모델을 학습하는 방법을 설명합니다.
이 모듈은 이미 K-Means Clustering 모듈을 사용하여 구성한 학습되지 않은 클러스터링 모델을 사용하며 레이블이 지정되거나 지정되지 않은 데이터 세트를 사용하여 모델을 학습합니다. 이 모듈은 예측에 사용할 수 있는 학습된 모델과 학습 데이터의 각 사례에 대한 클러스터 할당 집합을 만듭니다.
참고
기계 학습 모델을 만들기 위한 제네릭 모듈인 모델 학습 모듈을 사용하여 클러스터링 모델을 학습시킬 수 없습니다. 모델 학습은 감독된 학습 알고리즘에서만 작동하기 때문입니다. K-Means 및 다른 클러스터링 알고리즘을 사용하는 경우 자율 학습을 허용합니다. 즉, 알고리즘이 레이블이 지정되지 않은 데이터를 통해 학습할 수 있습니다.
클러스터링 모델 학습을 사용하는 방법
Studio(클래식)에서 실험에 클러스터링 모델 학습 모듈을 추가합니다. 학습 범주의 기계 학습 모듈 아래에서 모듈을 찾을 수 있습니다.
K-Means Clustering 모듈이나 호환되는 클러스터링 모델을 만들고 클러스터링 모델의 매개 변수를 설정하는 다른 사용자 지정 모듈을 추가합니다.
클러스터링 모델 학습의 오른쪽 입력에 학습 데이터 세트를 연결합니다.
열 집합에서 클러스터를 작성하는 데 사용할 데이터 세트의 열을 선택합니다. 올바른 기능을 제공하는 열을 선택해야 합니다. 예를 들어 ID 또는 고유한 값이 있는 다른 열을 사용하거나 모든 값이 같은 열을 사용하지 마십시오.
레이블을 사용할 수 있는 경우 해당 레이블을 기능으로 사용하거나 그대로 둘 수 있습니다.
새 클러스터 레이블과 함께 학습 데이터를 출력하려면 [ 추가 확인] 또는 [결과만 선택 취소] 옵션을 선택합니다.
이 옵션의 선택을 취소하면 클러스터 할당만 출력됩니다.
실험을 실행하거나 클러스터링 모델 학습 모듈을 클릭하고 선택한 실행을 선택합니다.
결과
학습을 완료한 후:
그래프에서 클러스터와 해당 분리를 보려면 결과 데이터 세트 출력을 마우스 오른쪽 단추로 클릭하고 시각화를 선택합니다.
그래프는 실제 값이 아닌 클러스터의 주 구성 요소를 나타냅니다. 자세한 내용은 주 구성 요소 분석을 참조하세요.
데이터 세트의 값을 보려면 데이터 세트 로 변환 모듈의 인스턴스를 추가하고 결과 데이터 세트 출력에 연결합니다. 데이터 세트로 변환 모듈을 실행하여 보거나 다운로드할 수 있는 데이터의 복사본을 가져옵니다.
나중에 다시 사용할 수 있도록 학습된 모델을 저장하려면 모듈을 마우스 오른쪽 단추로 클릭하고 학습된 모델을 선택한 다음 학습된 모델로 저장을 클릭합니다.
모델에서 점수를 생성하려면 클러스터에 데이터 할당을 사용합니다.
예
기계 학습에서 클러스터링을 사용하는 방법의 예는 Azure AI 갤러리를 참조하세요.
클러스터링: 유사한 회사 찾기: 구조화되지 않은 텍스트에서 파생된 특성에 클러스터링을 사용하는 방법을 보여 줍니다.
클러스터링: 색 양자화: 클러스터링을 사용하여 관련 색을 찾고 이미지에 사용되는 비트 수를 줄이는 방법을 보여 줍니다.
클러스터링: 붓꽃 데이터 그룹화: 붓꽃 데이터 세트를 기반으로 하는 간단한 클러스터링 예제를 제공합니다.
예상 입력
Name | 유형 | 설명 |
---|---|---|
학습되지 않은 모델 | ICluster 인터페이스 | 학습되지 않은 클러스터링 모델입니다. |
데이터 세트 | 데이터 테이블 | 입력 데이터 원본입니다. |
모듈 매개 변수
Name | 범위 | Type | 기본값 | 설명 |
---|---|---|---|---|
열 집합 | any | ColumnSelection | 열 선택 패턴입니다. | |
추가하려면 선택/결과만 출력하려면 선택 취소 | any | 부울 | true | 출력 데이터 집합에 할당 열이 추가된 입력 데이터 집합이 포함되어야 하는지(선택) 아니면 할당 열만 포함되어야 하는지(선택 취소)를 지정합니다. |
출력
Name | 유형 | Description |
---|---|---|
학습된 모델 | ICluster 인터페이스 | 학습된 클러스터링 모델입니다. |
결과 데이터 집합 | 데이터 테이블 | 할당의 데이터 열이 추가되거나 할당 열만 포함된 입력 데이터 집합입니다. |
예외
예외 | 설명 |
---|---|
오류 0003 | 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다. |
Studio(클래식) 모듈과 관련된 오류 목록은 Machine Learning 오류 코드를 참조하세요.
API 예외 목록은 Machine Learning REST API 오류 코드를 참조하세요.