열 배포(데이터 마이닝)
Microsoft SQL Server Analysis Services 마이닝 구조에서 열 분포를 정의하여 마이닝 모델을 만들 때 알고리즘이 해당 열의 데이터를 처리하는 방식에 영향을 줄 수 있습니다. 이렇게 하면 공통적인 값 배포가 열에 포함되어 있을 경우 모델을 처리하기 전에 몇몇 알고리즘에서 연속 열 배포를 정의하는 데 도움이 됩니다. 배포를 정의하지 않으면 알고리즘이 데이터를 해석하는 데 사용할 정보가 더 줄어듭니다. 따라서 마이닝 모델에서 얻는 예측의 정확도가 배포를 정의했을 경우보다 낮아질 수 있습니다.
Analysis Services에서 사용할 수 있는 알고리즘은 다음 배포 유형을 지원합니다.
Normal
연속 열의 값은 정규 분포를 사용하여 히스토그램을 형성합니다.
과
Log Normal
연속 열의 값은 히스토그램을 형성합니다. 여기서 곡선은 위쪽 끝에서 길어지고 아래쪽 끝쪽으로 기울어져 있습니다.
및
Uniform
연속 열의 값은 모든 값이 균등하게 표시되는 평평한 곡선을 형성합니다.
Analysis Services에서 제공하는 알고리즘에 대한 자세한 내용은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하세요.
참고 항목
콘텐츠 형식(데이터 마이닝)마이닝 구조(Analysis Services - 데이터 마이닝)불연속화 메서드(데이터 마이닝)배포(DMX)마이닝 구조 열