Explorando o modelo Naive Bayes (Tutorial de mineração de dados básico)
O algoritmo Microsoft Naive Bayes oferece diversos métodos para a exibição da interação entre a compra de bicicleta e os atributos de entrada.
O Visualizador do Microsoft Naive Bayes oferece as seguintes guias a serem usadas na exploração de modelos de mineração Naive Bayes:
Dependency Network
Attribute Profiles
Attribute Characteristics
Attribute Discrimination
As seções a seguir descrevem como explorar os outros modelos de mineração.
Rede de Dependências
A guia Rede de Dependências funciona como a guia Rede de Dependências para o Visualizador de Árvore da Microsoft. Cada nó no visualizador representa um atributo e as linhas entre os nós representam as relações. No visualizador, você pode ver todos os atributos que afetam o estado do atributo de previsão, Comprador de Bicicletas.
Para explorar o modelo na guia Rede de Dependências
Use a lista Modelo de Mineração na parte superior da guia Visualizador do Modelo de Mineração para alternar para o modelo TM_NaiveBayes.
Use a lista Visualizador para alternar para o Visualizador Microsoft Naive Bayes.
Clique no nó Comprador de Bicicleta para identificar suas dependências.
O sombreamento rosa indica que todos os atributos influenciam a compra de bicicletas.
Ajuste o controle deslizante para identificar o atributo mais influente.
À medida que você abaixa o controle deslizante, somente os atributos com o efeito maior sobre a coluna [Comprador de Bicicleta] permanecem. Ao ajustar o controle deslizante, você poderá descobrir que alguns dos atributos mais influentes são: o número de carros, distância do trabalho e número total de crianças.
Voltar ao início
Perfis de Atributo
A guia Perfis de Atributo descreve como os estados diferentes dos atributos de entrada afetam o resultado do atributo de previsão.
Para explorar o modelo na guia Perfis de Atributo
Na caixa Previsível, verifique se Comprador de Bicicletas é selecionado.
Se a Legenda de Mineração estiver bloqueando a exibição dos Perfis de atributo, tire-a do caminho.
Na caixa de barras Histograma, selecione 5.
Em nosso modelo, 5 é o número máximo de estados para qualquer variável.
Os atributos que afetam o estado desse atributo previsível estão listados juntos com os valores de cada estado dos atributos de entrada e suas distribuições em cada estado do atributo previsível.
Na coluna Atributos, localize Número de Carros. Observe as diferenças nos histogramas de compradores de bicicleta (coluna rotulada 1) e não-compradores de bicicleta (coluna rotulada 0). Uma pessoa com nenhum ou com um carro tem muito mais probabilidade de comprar uma bicicleta.
Clique duas vezes na célula Número de Carros da coluna comprador de bicicleta (coluna rotulada 1).
A Legenda de Mineração mostra uma exibição mais detalhada.
Voltar ao início
Características do Atributo
Com a guia Características do Atributo, você pode selecionar um atributo e valor para ver a freqüência com que os valores aparecem para outros atributos nos casos do valor selecionados.
Para explorar o modelo na guia Características do Atributo
Na lista Atributo, verifique se Comprador de Bicicleta está selecionado.
Defina o Valor como 1.
No visualizador, você verá que clientes sem filhos em casa, com pequenas distâncias até o trabalho e que moram na região da América do Norte têm mais probabilidade de comprarem uma bicicleta.
Voltar ao início
Distinção de Atributo
Com a guia Distinção de Atributo, você pode investigar a relação entre dois valores discretos de compra de bicicleta e de outros valores de atributo. Uma vez que o modelo TM_NaiveBayes tem apenas dois estados, 1 e 0, você não precisará fazer quaisquer alterações para o visualizador.
No visualizador, você pode ver que as pessoas que não têm carro tendem a comprar bicicletas, e que as pessoas que têm dois carros tendem a não comprar bicicletas.
Consulte também