Compartilhar via


PredictCaseLikelihood (DMX)

Aplica-se a: SQL Server Analysis Services

Esta função retorna a probabilidade de um caso de entrada se ajustar no modelo existente. Usado somente com modelos de cluster.

Sintaxe

  
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])  

Argumentos

NORMALIZED
O valor de retorno contém a probabilidade do caso com o modelo dividido pela probabilidade do caso sem o modelo.

NONNORMALIZED
O valor de retorno contém a probabilidade bruta do caso, que é o produto das probabilidades dos atributos de caso.

Aplica-se A

Modelos criados usando os algoritmos Microsoft Clustering e Microsoft Sequence Clustering.

Tipo de retorno

Número de ponto flutuante da dupla precisão entre 0 e 1. Um número próximo de 1 indica que o caso tem uma alta probabilidade de ocorrer neste modelo. Um número próximo de 0 indica que o caso tem pouca probabilidade de ocorrer neste modelo.

Comentários

Por padrão, o resultado da função PredictCaseLikelihood é normalizado. Em geral, os valores normalizados são mais úteis à medida que o número de atributos de um caso aumenta e as diferenças entre as probabilidades brutas de quaisquer dois casos tornam-se muito menores.

A seguinte equação é usada para calcular os valores normalizados, determinados x e y:

  • x = probabilidade do caso baseada no modelo de cluster

  • y = probabilidade de caso marginal, calculada como a probabilidade de log do caso com base na contagem dos casos de treinamento

  • Z = Exp( log(x) - Log(Y))

Normalizado = (z/ (1+z))

Exemplos

O exemplo a seguir retorna a probabilidade de que o caso especificado ocorra dentro do modelo de clustering, que se baseia no banco de dados Adventure Works DW.

SELECT  
  PredictCaseLikelihood() AS Default_Likelihood,  
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,  
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,  
FROM  
  [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
  '2-5 Miles' AS [Commute Distance],  
  'Graduate Degree' AS [Education],  
  0 AS [Number Cars Owned],  
  0 AS [Number Children At Home]) AS t  

Resultados esperados:

Default_Likelihood Normalized_Likelihood Raw_Likelihood
6.30672792729321E-08 6.30672792729321E-08 9.5824454056846E-48

A diferença entre esses resultados demonstra o efeito da normalização. O valor bruto de CaseLikelihood sugere que a probabilidade do caso é de cerca de 20%; no entanto, quando você normaliza os resultados, fica claro que a probabilidade do caso é muito baixa.

Confira também

Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Referência de função DMX (Data Mining Extensions)
Funções (DMX)
Funções de previsão gerais (DMX)