PredictCaseLikelihood(DMX)
적용 대상: SQL Server Analysis Services
이 함수는 입력 사례가 기존 모델에 맞을 가능성을 반환합니다. 클러스터링 모델에서만 사용됩니다.
구문
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
인수
NORMALIZED
모델에 있는 사례의 확률을 모델이 없는 사례의 확률로 나눈 값이 반환됩니다.
NONNORMALIZED
반환 값은 사례 특성의 확률에 대한 곱인 사례의 원시 확률을 포함합니다.
적용 대상
Microsoft 클러스터링 및 Microsoft 시퀀스 클러스터링 알고리즘을 사용하여 빌드된 모델입니다.
반환 형식
0에서 1 사이의 배정밀도 부동 소수점 숫자입니다. 1에 가까울수록 이 모델에 사례가 나타날 확률이 높음을 나타내고 0에 가까운 숫자는 이 모델에서 사례가 발생할 가능성이 적다는 것을 나타냅니다.
설명
기본적으로 PredictCaseLikelihood 함수의 결과가 정규화됩니다. 일반적으로 정규화된 값은 사례의 특성 수가 증가하고 두 사례의 원시 확률 간의 차이가 훨씬 작아짐에 따라 더 유용합니다.
다음 수식은 x와 y가 지정된 정규화된 값을 계산하는 데 사용됩니다.
x = 클러스터링 모델을 기반으로 하는 사례의 가능성
y = 한계 사례 가능성, 학습 사례 계산에 따라 사례의 로그 가능성으로 계산됨
Z = Exp( log(x) - Log(Y))
정규화된 = (z/(1+z))
예제
다음 예제에서는 Adventure Works DW 데이터베이스를 기반으로 하는 클러스터링 모델 내에서 지정된 사례가 발생할 가능성을 반환합니다.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
예상 결과:
Default_Likelihood | Normalized_Likelihood | Raw_Likelihood |
---|---|---|
6.30672792729321E-08 | 6.30672792729321E-08 | 9.58244454056846E-48 |
이러한 결과 간의 차이는 정규화의 효과를 보여 줍니다. CaseLikelihood의 원시 값은 사례의 확률이 약 20%임을 시사합니다. 그러나 결과를 정규화하면 사례 가능성이 매우 낮다는 것이 명백해집니다.
참고 항목
데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)
DMX(데이터 마이닝 확장) 함수 참조
함수(DMX)
일반 예측 함수(DMX)