Partilhar via


Explorando o modelo de árvore de decisão (Tutorial de mineração de dados básico)

O algoritmo Árvores de Decisão da Microsoft prevê que colunas influenciam a decisão de compra de uma bicicleta com base nas colunas restantes do conjunto de treinamento.

O Visualizador de Árvore de Decisão da Microsoft fornece as seguintes guias para serem usadas na exploração de modelos de mineração de árvore de decisão:

Árvore de Decisão

Rede de Dependências

As seções a seguir descrevem como selecionar o visualizador apropriado e explorar os outros modelos de mineração.

Guia Árvore de Decisão

Na guia Árvore de Decisão, examine todos os três modelos que formam um modelo de mineração.

Uma vez que o modelo de correspondência destinada neste projeto de tutorial contém apenas um único atributo previsível, Comprador de Bicicleta, há somente uma única árvore a ser visualizada. Se houver mais árvores, você pode usar a caixa Árvore para escolher outra árvore.

A revisão do modelo TM_Decision_Tree no visualizador Árvore de Decisão revela que a idade é o único fator importante na previsão da compra de bicicletas. O interessante é que, uma vez que você agrupa os clientes por idade, a próxima ramificação da árvore será diferente para cada nó de idade. Ao explorar a guia Árvore de Decisão, podemos concluir que os compradores entre 34 e 40 anos com um ou nenhum carro têm grande probabilidade de comprar uma bicicleta e que clientes mais novos e solteiros que vivem na região do Pacífico e que têm um ou nenhum carro também têm grande probabilidade de comprar uma bicicleta.

Para explorar o modelo na guia Árvore de Decisão

  1. Selecione a guia Visualizador do Modelo de Mineração no Designer de Mineração de Dados.

    Por padrão, o designer é aberto no primeiro modelo adicionado à estrutura -- nesse caso, TM_Decision_Tree.

  2. Use os botões de lente de aumento para ajustar o tamanho da exibição da árvore.

    Por padrão, o Visualizador de Árvore da Microsoft mostra somente os três primeiros níveis da árvore. Se a árvore tiver menos de três níveis, o visualizador mostrará só os níveis existentes. Você pode exibir mais níveis usando o controle deslizante Mostrar Nível ou a lista Expansão Padrão.

  3. Deslize Mostrar Nível até a quarta barra.

  4. Altere o valor de Plano de Fundo para 1.

    Ao alterar a configuração de Plano de Fundo, você poderá visualizar rapidamente o número de casos em cada nó que têm o valor de destino 1 para [Comprador de Bicicleta]. Lembre-se de que neste cenário específico, cada caso representa um cliente. O valor 1 indica que o cliente comprou uma bicicleta antes; o valor 0 indica que o cliente nunca comprou uma bicicleta. Quanto mais escuro for o sombreamento do nó, maior será a porcentagem de casos desse nó com o valor de destino.

  5. Posicione o seu cursor sobre o nó chamado Todos. Uma dica de ferramenta será exibida com as seguintes informações:

    • Número total de casos

    • Número de casos de pessoas que não compram bicicleta

    • Número de casos de compradores de bicicleta

    • Número de casos com valores ausentes para [Comprador de Bicicleta]

    Como alternativa, coloque o seu cursor sobre qualquer nó da árvore para ver a condição exigida para alcançar aquele nó a partir do nó anterior. Também é possível exibir essas informações em Legenda de Mineração.

  6. Clique no nó para Idade >=34 e < 41. O histograma é exibido como uma barra horizontal final no nó e representa a distribuição de clientes nesse intervalo de idade que compraram (rosa) e que não compraram (azul) uma bicicleta anteriormente. O Visualizador nos mostra que os clientes entre os 34 e os 40 anos com um ou nenhum carro têm probabilidade de comprar uma bicicleta. Levando isso um pouco mais adiante, descobrimos que a probabilidade de compra de uma bicicleta aumenta caso o cliente tenha realmente entre 38 e 40 anos.

Como você habilitou o detalhamento quando criou a estrutura e o modelo, poderá recuperar informações detalhadas dos casos de modelo e da estrutura de mineração, incluindo as colunas não incluídas no modelo de mineração (por exemplo, emailAddress, FirstName).

Para obter mais informações, consulte Usando a análise nos modelos de mineração e nas estruturas de mineração (Analysis Services – Mineração de dados).

Para detalhar os dados de caso

  1. Clique com o botão direito do mouse em um nó e selecione Detalhar e Colunas do Modelo Somente.

    Os detalhes para cada caso de treinamento são exibidos em formato de planilha. Esses detalhes vêm da exibição vTargetMail, selecionada como a tabela de caso durante a criação da estrutura de mineração.

  2. Clique com o botão direito do mouse em um nó e selecione Detalhar e Colunas do Modelo e da Estrutura.

    A mesma planilha será exibida com as colunas da estrutura anexadas no final.

Voltar ao Início

Guia Rede de Dependências

A guia Rede de Dependências exibe os relacionamentos entre os atributos que contribuem para a capacidade de previsão do modelo de mineração. O visualizador Rede de Dependências reforça as nossas descobertas de que Idade e Região são fatores importantes na previsão de compra de bicicletas.

Para explorar o modelo na guia Rede de Dependências

  1. Clique no nó Comprador de Bicicleta para identificar suas dependências.

    O nó central para a rede de dependências, Comprador de Bicicleta, representa o atributo previsível no modelo de mineração. O sombreamento rosa indica que todos os atributos influenciam a compra de bicicletas.

  2. Ajuste o controle deslizante Todos os Links para identificar o atributo mais influente.

    À medida que você abaixa o controle deslizante, somente os atributos com o efeito maior sobre a coluna [Comprador de Bicicletas] permanecem. Ajustando o controle deslizante, você poderá descobrir que idade e região são os principais fatores para determinar se alguém é um comprador de bicicletas.