다음을 통해 공유


열 배포(데이터 마이닝)

Microsoft SQL Server Analysis Services 마이닝 구조에서 열 분포를 정의하여 마이닝 모델을 만들 때 알고리즘이 해당 열의 데이터를 처리하는 방식에 영향을 줄 수 있습니다. 이렇게 하면 공통적인 값 배포가 열에 포함되어 있을 경우 모델을 처리하기 전에 몇몇 알고리즘에서 연속 열 배포를 정의하는 데 도움이 됩니다. 배포를 정의하지 않으면 알고리즘이 데이터를 해석하는 데 사용할 정보가 더 줄어듭니다. 따라서 마이닝 모델에서 얻는 예측의 정확도가 배포를 정의했을 경우보다 낮아질 수 있습니다.

Analysis Services에서 사용할 수 있는 알고리즘은 다음 배포 유형을 지원합니다.

Normal 연속 열의 값은 정규 분포를 사용하여 히스토그램을 형성합니다.

정상 분포 히스토그램

Log Normal 연속 열의 값은 히스토그램을 형성합니다. 여기서 곡선은 위쪽 끝에서 길어지고 아래쪽 끝쪽으로 기울어져 있습니다.

로그 정규 분포 히스토그램

Uniform 연속 열의 값은 모든 값이 균등하게 표시되는 평평한 곡선을 형성합니다.

균일한 분포 히스토그램과 균일

Analysis Services에서 제공하는 알고리즘에 대한 자세한 내용은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하세요.

참고 항목

콘텐츠 형식(데이터 마이닝)마이닝 구조(Analysis Services - 데이터 마이닝)불연속화 메서드(데이터 마이닝)배포(DMX)마이닝 구조 열