次の方法で共有


PredictCaseLikelihood (DMX)

クラスター モデルでのみ使用されます。 この関数は、入力ケースが既存のモデル内に収まる確率を返します。

構文

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

引数

  • NORMALIZED
    戻り値は、モデル内のケースの確率をモデルのないケースの確率で除算した結果を格納します。

  • NONNORMALIZED
    戻り値は、ケースの未加工の確率、つまりケース属性の確率の積を格納します。

適用対象

Microsoft クラスタリング アルゴリズムと Microsoft シーケンス クラスター アルゴリズムを使用して作成されるモデルです。

戻り値の型

0 ~ 1 の範囲の倍精度浮動小数点値です。 値が 1 に近いほど、このモデルでケースが発生する確率が高くなります。 値が 0 に近いほど、このモデルでケースが発生する確率が低くなります。

説明

既定では、PredictCaseLikelihood 関数の結果は正規化されます。 通常、正規化された値は、ケース内の属性の数が増え、任意の 2 つのケースの未加工の確率の差が小さくなるほど、有用性が増します。

x と y を指定した、次の式を使用して、正規化された値を計算します。

  • x = クラスタリング モデルに基づいたケースの確率値

  • y = トレーニング ケースの数に基づいたケースの対数尤度として計算された、周辺確率の値

  • Z = Exp( log(x) – Log(Y))

正規化 = (z/ (1+z))

次の例は、指定したケースが「基本的なデータ マイニング チュートリアル」で作成したクラスター モデル内に発生する確率値を返します。

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

期待される結果 :

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

これらの結果の違いは、正規化の影響を示します。

変更履歴

変更内容

未加工の正規化された確率と正規化されていない (未加工の) 確率の違いが正確に示されるようにサンプルを修正しました。