PredictCaseLikelihood (DMX)
只適用於群集模型。這個函數會傳回輸入案例符合現有模型的可能性。
語法
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
引數
NORMALIZED
傳回值包含模型內案例的機率除以無模型案例的機率。NONNORMALIZED
傳回值包含案例的原始機率,也就是案例屬性機率的乘積。
適用於
使用 Microsoft 群集與 Microsoft 時序群集演算法建立的模型。
傳回類型
介於 0 和 1 之間的雙精度浮點數。較接近 1 的數字代表案例在此模型中發生的機率較高。較接近 0 的數字代表案例較不可能在此模型中發生。
備註
依預設,PredictCaseLikelihood 函數的結果會正規化。隨著案例中的屬性數增加,而任兩個案例之間的原始機率差異更小時,正規化的值通常會變得更有用。
下列方程式是在 x 和 y 已知時,用來計算正規化的值:
x = 以群集模型為基礎的案例可能性
y = 臨界案例可能性,根據計算培訓案例而計算為案例的對數可能性
Z = Exp( log(x) – Log(Y))
正規化 = (z/ (1+z))
範例
下列範例會傳回特定案例將會發生在<資料採礦基本教學課程>內所建立之群集模型中的可能性。
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
預期的結果:
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
這些結果之間的差異示範了正規化的效果。
變更記錄
更新的內容 |
---|
已修正範例,可精確顯示原始正規化與非正規化 (原始) 機率之間的差異。 |