Partager via


PredictCaseLikelihood (DMX)

Uniquement utilisée avec les modèles de clustering. Cette fonction retourne la probabilité qu'un cas d'entrée corresponde au modèle existant.

Syntaxe

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

Arguments

  • NORMALIZED
    La valeur de retour contient la probabilité du cas au sein du modèle divisée par la probabilité du cas sans le modèle.

  • NONNORMALIZED
    La valeur de retour contient la probabilité brute du cas, qui est le produit des probabilités des attributs de cas.

Application

Les modèles générés par les algorithmes Microsoft Clustering et Microsoft Sequence Clustering.

Type de valeur renvoyé

Nombre à virgule flottante double précision compris entre 0 et 1. Un nombre plus proche de 1 indique que le cas a une probabilité plus élevée de se produire dans ce modèle. Un nombre plus proche de 0 indique qu'il est moins probable que le cas se produise dans ce modèle.

Notes

Le résultat de la fonction PredictCaseLikelihood est normalisé par défaut. Les valeurs normalisées sont généralement plus utiles lorsque le nombre d'attributs d'un cas augmente et que les différences entre les probabilités brutes de deux cas deviennent beaucoup moins importantes.

L'équation suivante est utilisée pour calculer les valeurs normalisées pour des valeurs x et y données :

  • x = probabilité du cas en fonction du modèle de clustering

  • y = probabilité de cas marginale, calculée comme le logarithme du rapport de vraisemblance du cas en fonction des cas d'apprentissage

  • Z = Exp( log(x) – Log(Y))

Valeur normalisée = (z/ (1+z))

Exemple

L'exemple suivant retourne la probabilité selon laquelle le cas spécifié se produira dans le modèle de clustering créé dans le Didacticiel sur l'exploration de données de base.

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

Résultats attendus :

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

La différence entre ces résultats montre l'effet de la normalisation.

Historique des modifications

Mise à jour du contenu

Correction de l'exemple pour illustrer avec précision les différences entre les probabilités brutes normalisées et non normalisées.