구성 요소: 클러스터에 데이터 할당
이 문서에서는 Azure Machine Learning 디자이너에서 클러스터에 데이터 할당 구성 요소를 사용하는 방법을 설명합니다 . 구성 요소는 K-평균 클러스터링 알고리즘으로 학습된 클러스터링 모델을 통해 예측을 생성합니다.
클러스터에 데이터 할당 구성 요소는 새로운 각 데이터 포인트에 대한 가능한 할당을 포함하는 데이터 세트를 반환합니다.
클러스터에 데이터 할당을 사용하는 방법
Azure Machine Learning 디자이너에서 이전에 학습된 클러스터링 모델을 찾습니다. 다음 방법 중 하나를 사용하여 클러스터링 모델을 만들고 학습할 수 있습니다.
K-평균 클러스터링 구성 요소를 사용하여 K-평균 클러스터링 알고리즘을 구성한 다음, 데이터 세트 및 클러스터링 모델 학습 구성 요소(이 문서)를 사용하여 모델을 학습합니다.
작업 영역의 저장된 모델 그룹에서 학습된 기존 클러스터링 모델을 추가할 수도 있습니다.
학습된 모델을 클러스터에 데이터 할당의 왼쪽 입력 포트에 연결합니다.
새 데이터 세트를 입력으로 연결합니다.
이 데이터 세트에서 레이블은 선택 사항입니다. 일반적으로 클러스터링이 감독되지 않는 학습 방법입니다. 범주를 미리 알 수 없습니다. 그러나 입력 열은 클러스터링 모델 학습에 사용된 열과 동일해야 합니다. 그렇지 않으면 오류가 발생합니다.
팁
클러스터 예측에서 디자이너에 기록되는 열 수를 줄이려면 데이터 세트에서 열 선택을 사용하고 열의 하위 집합을 선택합니다.
결과에 결과를 표시하는 열(클러스터 할당)을 포함하여 전체 입력 데이터 세트를 포함하도록 하려면 결과 전용 확인란을 선택하거나 추가 확인란을 선택 취소합니다.
이 확인란의 선택을 취소하면 결과만 반환됩니다. 이 옵션은 웹 서비스의 일부로 예측을 만들 때 유용할 수 있습니다.
파이프라인을 제출합니다.
결과
- 데이터 세트의 값을 보려면 구성 요소를 마우스 오른쪽 단추로 클릭하고 시각화를 선택합니다. 또는 구성 요소를 선택하고 오른쪽 패널에서 출력 탭으로 전환한 다음, 포트 출력에서 히스토그램 아이콘을 클릭하여 결과를 시각화합니다.