Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de Dados)

Artigo
07/30/2013

Este tópico descreve o conteúdo do modelo de mineração que é específico para modelos que usam o algoritmo Regressão Logística da Microsoft. Para obter uma explicação de como interpretar as estatísticas e a estrutura compartilhada por todos os tipos de modelos, e definições gerais dos termos relacionados ao conteúdo do modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).

Entendendo a estrutura de um modelo de regressão logística

Um modelo de regressão logística é criado usando o algoritmo Rede Neural da Microsoft com parâmetros que restringem o modelo para eliminar o nó oculto. Portanto, a estrutura geral de um modelo de regressão logística é quase idêntica à de um modelo de rede neural: cada modelo tem um único nó pai que representa o modelo e seus metadados e um nó de estatísticas marginais especial (NODE_TYPE = 24) que fornece estatísticas descritivas sobre as entradas usadas no modelo.

Além disso, o modelo contém uma sub-rede (NODE_TYPE = 17) para cada atributo previsível. Exatamente como em um modelo de rede neural, cada sub-rede sempre contém duas ramificações: uma para a camada de entrada e outra que contém a camada oculta (NODE_TYPE = 19) e a camada de saída (NODE_TYPE = 20) da rede. A mesma sub-rede pode ser usada para diversos atributos se eles forem especificados como somente para previsão. Os atributos previsíveis que também são entradas podem não ser exibidos na mesma sub-rede.

Porém, em um modelo de regressão logística, o nó que representa a camada oculta está vazio e não tem nenhum filho. Sendo assim, o modelo contém nós que representam saídas individuais (NODE_TYPE = 23) e entradas individuais (NODE_TYPE = 21), mas não nós ocultos individuais.

estrutura de conteúdo do modelo de regressão logística

Por padrão, um modelo de regressão logística é exibido no Visualizador de Rede Neural da Microsoft. Com esse visualizador personalizado, você pode filtrar os atributos de entrada e seus valores e visualizar, graficamente, como eles afetam as saídas. As dicas de ferramentas no visualizador mostram a probabilidade e a comparação de precisão associadas a cada par de valores de entrada e saída. Para obter mais informações, consulte Procurar um modelo usando o Visualizador de Rede Neural da Microsoft.

Para explorar a estrutura de entradas e sub-redes e visualizar estatísticas detalhadas, você pode usar o Visualizador de Árvore de Conteúdo Genérica da Microsoft. É possível clicar em qualquer nó para expandi-lo e visualizar os nós filho ou exibir as ponderações e outras estatísticas contidas no nó.

Conteúdo de um modelo de regressão logística

Esta seção fornece detalhes e exemplos somente para as colunas do conteúdo do modelo de mineração que são relevantes para a regressão logística. O conteúdo do modelo é praticamente idêntico ao de um modelo de rede neural, porém as descrições que se aplicam aos modelos de rede neural podem ser repetidas aqui por conveniência.

Para obter informações sobre colunas de fins gerais no conjunto de linhas de esquema, como MODEL_CATALOG e MODEL_NAME, que não são descritas aqui, ou para obter explicações da terminologia do modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).

MODEL_CATALOG
Nome do banco de dados no qual o modelo é armazenado.
MODEL_NAME
Nome do modelo.

ATTRIBUTE_NAME
O nome do atributo que corresponde a esse nó.

Nó	Conteúdo
Raiz do modelo	Em branco
Estatísticas marginais	Em branco
Camada de entrada	Em branco
Nó de entrada	Nome do atributo de entrada
Camada oculta	Em branco
Camada de saída	Em branco
Nó de saída	Nome do atributo de saída

NODE_NAME
O nome do nó. Atualmente, esta coluna contém o mesmo valor de NODE_UNIQUE_NAME, embora isso possa mudar em versões futuras.
NODE_UNIQUE_NAME
Nome exclusivo do nó.

Para obter mais informações sobre como os nomes e as IDs fornecem dados estruturais sobre o modelo, consulte a seção, Usando nomes e IDs de nós.

NODE_TYPE
Um modelo de regressão logística gera os seguintes tipos de nó:

ID do tipo de nó	Descrição
1	Modelo.
17	Nó do organizador para a sub-rede.
18	Nó do organizador da camada de entrada.
19	Nó do organizador da camada oculta. A camada oculta é vazia.
20	Nó do organizador da camada de saída.
21	Nó do atributo de entrada.
23	Nó do atributo de saída.
24	Nó de estatísticas marginais.

NODE_CAPTION
Um rótulo ou uma legenda associada ao nó. Em modelos de regressão logística, sempre em branco.

CHILDREN_CARDINALITY
Uma estimativa do número de filhos do nó.

Nó	Conteúdo
Raiz do modelo	Indica a contagem de nós filho, que inclui pelo menos 1 rede, 1 nó marginal necessário e 1 camada de entrada necessária. Por exemplo, se o valor for 5, haverá 3 sub-redes.
Estatísticas marginais	Sempre 0.
Camada de entrada	Indica o número de pares de atributo-valores de entrada usados pelo modelo.
Nó de entrada	Sempre 0.
Camada oculta	Em um modelo de regressão logística, sempre 0.
Camada de saída	Indica o número de valores de saída.
Nó de saída	Sempre 0.

PARENT_UNIQUE_NAME
O nome exclusivo do nó pai. NULL é retornado para todos os nós em nível raiz.

Para obter mais informações sobre como os nomes e as IDs fornecem dados estruturais sobre o modelo, consulte a seção, Usando nomes e IDs de nós.

NODE_DESCRIPTION
Uma descrição amigável do nó.

Nó	Conteúdo
Raiz do modelo	Em branco
Estatísticas marginais	Em branco
Camada de entrada	Em branco
Nó de entrada	Nome do atributo de entrada
Camada oculta	Em branco
Camada de saída	Em branco
Nó de saída	Se o atributo de saída for contínuo, conterá o nome do atributo de saída. Se o atributo de saída for discreto ou diferenciado, contém o nome do atributo e o valor.

NODE_RULE
Uma descrição XML da regra é inserida no nó.

Nó	Conteúdo
Raiz do modelo	Em branco
Estatísticas marginais	Em branco
Camada de entrada	Em branco
Nó de entrada	Um fragmento de XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.
Camada oculta	Em branco
Camada de saída	Em branco
Nó de saída	Um fragmento de XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.

MARGINAL_RULE
Em modelos de regressão logística, sempre em branco.
NODE_PROBABILITY
A probabilidade associada a este nó. Em modelos de regressão logística, sempre 0.
MARGINAL_PROBABILITY
A probabilidade de que o nó seja alcançado a partir do nó pai. Em modelos de regressão logística, sempre 0.
NODE_DISTRIBUTION
Uma tabela aninhada que contém informações estatísticas para o nó. Para obter informações detalhadas sobre o conteúdo dessa tabela em cada tipo de nó, consulte a seção Entendendo a tabela NODE_DISTRIBUTION em Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de Dados).

NODE_SUPPORT
Em modelos de regressão logística, sempre 0.

Observação
O suporte a probabilidades é sempre 0 porque a saída desse tipo modelo não é probabilística. A única coisa significativa para esse algoritmo são as ponderações. Sendo assim, o algoritmo não computa probabilidade, suporte ou variação.

Para obter informações sobre o suporte nos casos de treinamento para valores específicos, consulte o nó de estatísticas marginais.

MSOLAP_MODEL_COLUMN

Nó	Conteúdo
Raiz do modelo	Em branco
Estatísticas marginais	Em branco
Camada de entrada	Em branco
Nó de entrada	Nome do atributo de entrada.
Camada oculta	Em branco
Camada de saída	Em branco
Nó de saída	Nome do atributo de entrada.

MSOLAP_NODE_SCORE
Em modelos de regressão logística, sempre 0.
MSOLAP_NODE_SHORT_CAPTION
Em modelos de regressão logística, sempre em branco.

Usando nomes de nó e IDs

A nomenclatura dos nós em um modelo de regressão logística fornece mais informações sobre os tipos de relações entre os nós no modelo. A tabela a seguir mostra as convenções para as IDs atribuídas aos nós em cada camada.

Tipo de nó	Convenção da ID de nó
Raiz do modelo (1)	00000000000000000.
Nó de estatísticas marginais (24)	10000000000000000
Camada de entrada (18)	30000000000000000
Nó de entrada (21)	Inicia às 60000000000000000
Sub-rede (17)	20000000000000000
Camada oculta (19)	40000000000000000
Camada de saída (20)	50000000000000000
Nó de saída (23)	Inicia às 80000000000000000

Você pode usar essas IDs para determinar como os atributos de saída são relacionados a atributos específicos da camada de entrada exibindo a tabela NODE_DISTRIBUTION no nó de saída. Cada linha nessa tabela contém uma ID que indica um nó de atributo de entrada específico. A tabela NODE_DISTRIBUTION também contém o coeficiente para o par de entrada-saída.

Consulte também

Referência

Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de Dados)

Referência técnica do algoritmo Regressão Logística da Microsoft

Conceitos

Algoritmo Regressão Logística da Microsoft

Exemplos de consulta de modelo de regressão logística

Compartilhar via