PredictCaseLikelihood (DMX)
クラスター モデルでのみ使用されます。 この関数は、入力ケースが既存のモデル内に収まる確率を返します。
構文
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
引数
NORMALIZED
戻り値は、モデル内のケースの確率をモデルのないケースの確率で除算した結果を格納します。NONNORMALIZED
戻り値は、ケースの未加工の確率、つまりケース属性の確率の積を格納します。
適用対象
Microsoft クラスタリング アルゴリズムと Microsoft シーケンス クラスター アルゴリズムを使用して作成されるモデルです。
戻り値の型
0 ~ 1 の範囲の倍精度浮動小数点値です。 値が 1 に近いほど、このモデルでケースが発生する確率が高くなります。 値が 0 に近いほど、このモデルでケースが発生する確率が低くなります。
説明
既定では、PredictCaseLikelihood 関数の結果は正規化されます。 通常、正規化された値は、ケース内の属性の数が増え、任意の 2 つのケースの未加工の確率の差が小さくなるほど、有用性が増します。
x と y を指定した、次の式を使用して、正規化された値を計算します。
x = クラスタリング モデルに基づいたケースの確率値
y = トレーニング ケースの数に基づいたケースの対数尤度として計算された、周辺確率の値
Z = Exp( log(x) – Log(Y))
正規化 = (z/ (1+z))
例
次の例は、指定したケースが「基本的なデータ マイニング チュートリアル」で作成したクラスター モデル内に発生する確率値を返します。
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
期待される結果 :
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
これらの結果の違いは、正規化の影響を示します。
関連項目
参照
概念
変更履歴
変更内容 |
---|
未加工の正規化された確率と正規化されていない (未加工の) 確率の違いが正確に示されるようにサンプルを修正しました。 |