Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de Dados)
Este tópico descreve o conteúdo do modelo de mineração que é específico para modelos que usam o algoritmo Regressão Logística da Microsoft. Para obter uma explicação de como interpretar as estatísticas e a estrutura compartilhada por todos os tipos de modelos, e definições gerais dos termos relacionados ao conteúdo do modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).
Entendendo a estrutura de um modelo de regressão logística
Um modelo de regressão logística é criado usando o algoritmo Rede Neural da Microsoft com parâmetros que restringem o modelo para eliminar o nó oculto. Portanto, a estrutura geral de um modelo de regressão logística é quase idêntica à de um modelo de rede neural: cada modelo tem um único nó pai que representa o modelo e seus metadados e um nó de estatísticas marginais especial (NODE_TYPE = 24) que fornece estatísticas descritivas sobre as entradas usadas no modelo.
Além disso, o modelo contém uma sub-rede (NODE_TYPE = 17) para cada atributo previsível. Exatamente como em um modelo de rede neural, cada sub-rede sempre contém duas ramificações: uma para a camada de entrada e outra que contém a camada oculta (NODE_TYPE = 19) e a camada de saída (NODE_TYPE = 20) da rede. A mesma sub-rede pode ser usada para diversos atributos se eles forem especificados como somente para previsão. Os atributos previsíveis que também são entradas podem não ser exibidos na mesma sub-rede.
Porém, em um modelo de regressão logística, o nó que representa a camada oculta está vazio e não tem nenhum filho. Sendo assim, o modelo contém nós que representam saídas individuais (NODE_TYPE = 23) e entradas individuais (NODE_TYPE = 21), mas não nós ocultos individuais.
Por padrão, um modelo de regressão logística é exibido no Visualizador de Rede Neural da Microsoft. Com esse visualizador personalizado, você pode filtrar os atributos de entrada e seus valores e visualizar, graficamente, como eles afetam as saídas. As dicas de ferramentas no visualizador mostram a probabilidade e a comparação de precisão associadas a cada par de valores de entrada e saída. Para obter mais informações, consulte Procurar um modelo usando o Visualizador de Rede Neural da Microsoft.
Para explorar a estrutura de entradas e sub-redes e visualizar estatísticas detalhadas, você pode usar o Visualizador de Árvore de Conteúdo Genérica da Microsoft. É possível clicar em qualquer nó para expandi-lo e visualizar os nós filho ou exibir as ponderações e outras estatísticas contidas no nó.
Conteúdo de um modelo de regressão logística
Esta seção fornece detalhes e exemplos somente para as colunas do conteúdo do modelo de mineração que são relevantes para a regressão logística. O conteúdo do modelo é praticamente idêntico ao de um modelo de rede neural, porém as descrições que se aplicam aos modelos de rede neural podem ser repetidas aqui por conveniência.
Para obter informações sobre colunas de fins gerais no conjunto de linhas de esquema, como MODEL_CATALOG e MODEL_NAME, que não são descritas aqui, ou para obter explicações da terminologia do modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).
MODEL_CATALOG
Nome do banco de dados no qual o modelo é armazenado.MODEL_NAME
Nome do modelo.ATTRIBUTE_NAME
O nome do atributo que corresponde a esse nó.Nó
Conteúdo
Raiz do modelo
Em branco
Estatísticas marginais
Em branco
Camada de entrada
Em branco
Nó de entrada
Nome do atributo de entrada
Camada oculta
Em branco
Camada de saída
Em branco
Nó de saída
Nome do atributo de saída
NODE_NAME
O nome do nó. Atualmente, esta coluna contém o mesmo valor de NODE_UNIQUE_NAME, embora isso possa mudar em versões futuras.NODE_UNIQUE_NAME
Nome exclusivo do nó.Para obter mais informações sobre como os nomes e as IDs fornecem dados estruturais sobre o modelo, consulte a seção, Usando nomes e IDs de nós.
NODE_TYPE
Um modelo de regressão logística gera os seguintes tipos de nó:ID do tipo de nó
Descrição
1
Modelo.
17
Nó do organizador para a sub-rede.
18
Nó do organizador da camada de entrada.
19
Nó do organizador da camada oculta. A camada oculta é vazia.
20
Nó do organizador da camada de saída.
21
Nó do atributo de entrada.
23
Nó do atributo de saída.
24
Nó de estatísticas marginais.
NODE_CAPTION
Um rótulo ou uma legenda associada ao nó. Em modelos de regressão logística, sempre em branco.CHILDREN_CARDINALITY
Uma estimativa do número de filhos do nó.Nó
Conteúdo
Raiz do modelo
Indica a contagem de nós filho, que inclui pelo menos 1 rede, 1 nó marginal necessário e 1 camada de entrada necessária. Por exemplo, se o valor for 5, haverá 3 sub-redes.
Estatísticas marginais
Sempre 0.
Camada de entrada
Indica o número de pares de atributo-valores de entrada usados pelo modelo.
Nó de entrada
Sempre 0.
Camada oculta
Em um modelo de regressão logística, sempre 0.
Camada de saída
Indica o número de valores de saída.
Nó de saída
Sempre 0.
PARENT_UNIQUE_NAME
O nome exclusivo do nó pai. NULL é retornado para todos os nós em nível raiz.Para obter mais informações sobre como os nomes e as IDs fornecem dados estruturais sobre o modelo, consulte a seção, Usando nomes e IDs de nós.
NODE_DESCRIPTION
Uma descrição amigável do nó.Nó
Conteúdo
Raiz do modelo
Em branco
Estatísticas marginais
Em branco
Camada de entrada
Em branco
Nó de entrada
Nome do atributo de entrada
Camada oculta
Em branco
Camada de saída
Em branco
Nó de saída
Se o atributo de saída for contínuo, conterá o nome do atributo de saída.
Se o atributo de saída for discreto ou diferenciado, contém o nome do atributo e o valor.
NODE_RULE
Uma descrição XML da regra é inserida no nó.Nó
Conteúdo
Raiz do modelo
Em branco
Estatísticas marginais
Em branco
Camada de entrada
Em branco
Nó de entrada
Um fragmento de XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.
Camada oculta
Em branco
Camada de saída
Em branco
Nó de saída
Um fragmento de XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.
MARGINAL_RULE
Em modelos de regressão logística, sempre em branco.NODE_PROBABILITY
A probabilidade associada a este nó. Em modelos de regressão logística, sempre 0.MARGINAL_PROBABILITY
A probabilidade de que o nó seja alcançado a partir do nó pai. Em modelos de regressão logística, sempre 0.NODE_DISTRIBUTION
Uma tabela aninhada que contém informações estatísticas para o nó. Para obter informações detalhadas sobre o conteúdo dessa tabela em cada tipo de nó, consulte a seção Entendendo a tabela NODE_DISTRIBUTION em Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de Dados).NODE_SUPPORT
Em modelos de regressão logística, sempre 0.Observação O suporte a probabilidades é sempre 0 porque a saída desse tipo modelo não é probabilística. A única coisa significativa para esse algoritmo são as ponderações. Sendo assim, o algoritmo não computa probabilidade, suporte ou variação.
Para obter informações sobre o suporte nos casos de treinamento para valores específicos, consulte o nó de estatísticas marginais.
MSOLAP_MODEL_COLUMN
Nó
Conteúdo
Raiz do modelo
Em branco
Estatísticas marginais
Em branco
Camada de entrada
Em branco
Nó de entrada
Nome do atributo de entrada.
Camada oculta
Em branco
Camada de saída
Em branco
Nó de saída
Nome do atributo de entrada.
MSOLAP_NODE_SCORE
Em modelos de regressão logística, sempre 0.MSOLAP_NODE_SHORT_CAPTION
Em modelos de regressão logística, sempre em branco.
Usando nomes de nó e IDs
A nomenclatura dos nós em um modelo de regressão logística fornece mais informações sobre os tipos de relações entre os nós no modelo. A tabela a seguir mostra as convenções para as IDs atribuídas aos nós em cada camada.
Tipo de nó |
Convenção da ID de nó |
---|---|
Raiz do modelo (1) |
00000000000000000. |
Nó de estatísticas marginais (24) |
10000000000000000 |
Camada de entrada (18) |
30000000000000000 |
Nó de entrada (21) |
Inicia às 60000000000000000 |
Sub-rede (17) |
20000000000000000 |
Camada oculta (19) |
40000000000000000 |
Camada de saída (20) |
50000000000000000 |
Nó de saída (23) |
Inicia às 80000000000000000 |
Você pode usar essas IDs para determinar como os atributos de saída são relacionados a atributos específicos da camada de entrada exibindo a tabela NODE_DISTRIBUTION no nó de saída. Cada linha nessa tabela contém uma ID que indica um nó de atributo de entrada específico. A tabela NODE_DISTRIBUTION também contém o coeficiente para o par de entrada-saída.
Consulte também
Referência
Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de Dados)
Referência técnica do algoritmo Regressão Logística da Microsoft