다음을 통해 공유


PredictCaseLikelihood(DMX)

적용 대상: SQL Server Analysis Services

이 함수는 입력 사례가 기존 모델에 맞을 가능성을 반환합니다. 클러스터링 모델에서만 사용됩니다.

구문

  
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])  

인수

NORMALIZED
모델에 있는 사례의 확률을 모델이 없는 사례의 확률로 나눈 값이 반환됩니다.

NONNORMALIZED
반환 값은 사례 특성의 확률에 대한 곱인 사례의 원시 확률을 포함합니다.

적용 대상

Microsoft 클러스터링 및 Microsoft 시퀀스 클러스터링 알고리즘을 사용하여 빌드된 모델입니다.

반환 형식

0에서 1 사이의 배정밀도 부동 소수점 숫자입니다. 1에 가까울수록 이 모델에 사례가 나타날 확률이 높음을 나타내고 0에 가까운 숫자는 이 모델에서 사례가 발생할 가능성이 적다는 것을 나타냅니다.

설명

기본적으로 PredictCaseLikelihood 함수의 결과가 정규화됩니다. 일반적으로 정규화된 값은 사례의 특성 수가 증가하고 두 사례의 원시 확률 간의 차이가 훨씬 작아짐에 따라 더 유용합니다.

다음 수식은 x와 y가 지정된 정규화된 값을 계산하는 데 사용됩니다.

  • x = 클러스터링 모델을 기반으로 하는 사례의 가능성

  • y = 한계 사례 가능성, 학습 사례 계산에 따라 사례의 로그 가능성으로 계산됨

  • Z = Exp( log(x) - Log(Y))

정규화된 = (z/(1+z))

예제

다음 예제에서는 Adventure Works DW 데이터베이스를 기반으로 하는 클러스터링 모델 내에서 지정된 사례가 발생할 가능성을 반환합니다.

SELECT  
  PredictCaseLikelihood() AS Default_Likelihood,  
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,  
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,  
FROM  
  [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
  '2-5 Miles' AS [Commute Distance],  
  'Graduate Degree' AS [Education],  
  0 AS [Number Cars Owned],  
  0 AS [Number Children At Home]) AS t  

예상 결과:

Default_Likelihood Normalized_Likelihood Raw_Likelihood
6.30672792729321E-08 6.30672792729321E-08 9.58244454056846E-48

이러한 결과 간의 차이는 정규화의 효과를 보여 줍니다. CaseLikelihood의 원시 값은 사례의 확률이 약 20%임을 시사합니다. 그러나 결과를 정규화하면 사례 가능성이 매우 낮다는 것이 명백해집니다.

참고 항목

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)
DMX(데이터 마이닝 확장) 함수 참조
함수(DMX)
일반 예측 함수(DMX)