PredictCaseLikelihood (DMX)
Aplica-se a: SQL Server Analysis Services
Esta função retorna a probabilidade de um caso de entrada se ajustar no modelo existente. Usado somente com modelos de cluster.
Sintaxe
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
Argumentos
NORMALIZED
O valor de retorno contém a probabilidade do caso com o modelo dividido pela probabilidade do caso sem o modelo.
NONNORMALIZED
O valor de retorno contém a probabilidade bruta do caso, que é o produto das probabilidades dos atributos de caso.
Aplica-se A
Modelos criados usando os algoritmos Microsoft Clustering e Microsoft Sequence Clustering.
Tipo de retorno
Número de ponto flutuante da dupla precisão entre 0 e 1. Um número próximo de 1 indica que o caso tem uma alta probabilidade de ocorrer neste modelo. Um número próximo de 0 indica que o caso tem pouca probabilidade de ocorrer neste modelo.
Comentários
Por padrão, o resultado da função PredictCaseLikelihood é normalizado. Em geral, os valores normalizados são mais úteis à medida que o número de atributos de um caso aumenta e as diferenças entre as probabilidades brutas de quaisquer dois casos tornam-se muito menores.
A seguinte equação é usada para calcular os valores normalizados, determinados x e y:
x = probabilidade do caso baseada no modelo de cluster
y = probabilidade de caso marginal, calculada como a probabilidade de log do caso com base na contagem dos casos de treinamento
Z = Exp( log(x) - Log(Y))
Normalizado = (z/ (1+z))
Exemplos
O exemplo a seguir retorna a probabilidade de que o caso especificado ocorra dentro do modelo de clustering, que se baseia no banco de dados Adventure Works DW.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Resultados esperados:
Default_Likelihood | Normalized_Likelihood | Raw_Likelihood |
---|---|---|
6.30672792729321E-08 | 6.30672792729321E-08 | 9.5824454056846E-48 |
A diferença entre esses resultados demonstra o efeito da normalização. O valor bruto de CaseLikelihood sugere que a probabilidade do caso é de cerca de 20%; no entanto, quando você normaliza os resultados, fica claro que a probabilidade do caso é muito baixa.
Confira também
Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Referência de função DMX (Data Mining Extensions)
Funções (DMX)
Funções de previsão gerais (DMX)