Explorando os modelos de cesta de compras (Tutorial de mineração de dados intermediário)
Agora que você criou o modelo de Associação, já pode explorá-lo usando o Visualizador de Associação da Microsoft na guia Visualizador de Modelos de Mineração do Designer de Mineração de Dados. Este tutorial orienta você a usar o visualizador para explorar relacionamentos entre itens. O visualizador ajuda você a ver rapidamente quais produtos tendem a aparecer juntos e a obter uma idéia geral dos padrões emergentes.
O Visualizador de Associação da Microsoft contém três guias: Regras, Conjuntos de Itens e Rede de Dependências. Como cada guia revela uma exibição ligeiramente diferente dos dados, quando estiver explorando o modelo, normalmente você alternará entre os painéis diferentes várias vezes à medida que for procurando por idéias.
Guia Rede de Dependências
Guia Conjuntos de Itens
Guia Regras
Visualizador de Conteúdo Genérico
Para este tutorial, você começará na guia Rede de Dependências e usará a guia Regras e a guia Conjuntos de Itens para aprofundar o seu conhecimento sobre os relacionamentos revelados no visualizador. Usará também o Visualizador de Árvore de Conteúdo Genérica da Microsoft para recuperar estatísticas detalhadas para regras e conjuntos de itens individuais.
Guia Rede de Dependências
Com a guia Rede de Dependências, você pode investigar a interação dos itens diferentes no modelo. Cada nó do visualizador representa um item, enquanto que as linhas entre eles representam as regras. Selecionando um nó, você pode ver quais outros nós prevêem o item selecionado ou quais itens o item atual prevê. Em alguns casos, há uma associação bidirecional entre itens, significando que eles geralmente aparecem na mesma transação. Você pode fazer referência à legenda de cores na parte inferior da guia para determinar a direção da associação.
Uma linha conectando dois itens significa que é provável que esses itens apareçam em uma transação juntos. Em outras palavras, é provável que os clientes comprem esses itens juntos. O controle deslizante está associado à probabilidade da regra. Mova o controle deslizante para cima ou para baixo para filtrar associações fracas, o que significa regras com probabilidade baixa.
O gráfico de rede de dependência mostra regras de pares, que podem ser representadas logicamente como A->B, ou seja, se o Produto A for comprado, então é provável que o Produto B também será. O gráfico não pode mostrar regras do tipo AB->C. Se você mover o controle deslizante para mostrar todas as regras e ainda sim não ver linhas no gráfico, significa que não houve regras de pares que atendessem aos critérios dos parâmetros do algoritmo.
Você também pode localizar nós pelo nome, digitando as primeiras letras do nome do atributo. Para obter mais informações, consulte Caixa de diálogo Localizar Nó (Exibição do Visualizador do Modelo de Mineração ).
Para abrir o modo Associação no Visualizador de Regras de Associação da Microsoft
No Gerenciador de Soluções, clique duas vezes na estrutura Associação.
No Designer de Mineração de Dados, clique na guia Visualizador do Modelo de Mineração.
Selecione Associação na lista de modelos de mineração na lista suspensa Modelo de Mineração.
Para navegar no gráfico de dependências e localizar nós específicos
Na guia Visualizador do Modelo de Mineração, clique na guia Rede de Dependências
Clique em Ampliar várias vezes, até poder exibir com facilidade os rótulos de cada nó.
Por padrão, o gráfico exibe todos os nós visíveis. Em um modelo complexo, pode haver muitos nós, fazendo com que cada nó fique muito pequeno.
Clique no sinal + no canto inferior direito do visualizador e mantenha o botão do mouse pressionado para fazer uma panorâmica do gráfico.
No lado esquerdo do visualizador, arraste o controle deslizante para baixo, movendo-o de Todos os Links (o padrão) para a parte inferior do controle deslizante.
O visualizador atualiza o gráfico para mostrar somente a associação mais forte, entre os itens Pneu de Passeio e Tubo de Pneu de Passeio.
Clique no nó rotulado como Tubo de Pneu de Passeio = Existente.
O gráfico é atualizado para realçar somente os itens com uma forte relação com esse item. Observe a direção da seta entre os dois itens.
No lado esquerdo do visualizador, arraste o controle deslizante para cima novamente, movendo-o da parte inferior para a parte intermediária.
Observe as mudanças ocorridas na seta que conecta os dois itens.
Selecione Mostrar apenas nome de atributo na lista suspensa da parte superior do painel Rede de Dependências.
Os rótulos de texto do gráfico são atualizados para mostrarem somente o nome do modelo.
Voltar ao início
Guia Conjuntos de Itens
Em seguida, você aprenderá mais sobre as regras e conjuntos de itens gerados pelo modelo para os produtos Pneu de Passeio e Tubo de Pneu de Passeio. A guia Conjuntos de Itens exibe três partes importantes de informações relacionadas aos conjuntos de itens que o algoritmo Associação da Microsoft descobre:
**Suporte: **o número de transações nas quais o conjunto de itens ocorre.
**Tamanho: **o número de itens que estão no conjunto de itens.
**Itens: **uma lista dos itens que estão incluídos em cada conjunto de itens.
Dependendo como os parâmetros do algoritmo são definidos, o algoritmo poderia gerar muitos conjuntos de itens. Cada conjunto de itens retornado no visualizador representa as transações nas quais um item foi vendido. Usando os controles na parte superior da guia Conjuntos de Itens, você pode filtrar o visualizador para mostrar apenas os conjuntos de itens que contêm um suporte mínimo e tamanho do conjunto de itens especificado.
Se você estiver trabalhando com um modelo de mineração diferente e se nenhum conjunto de itens estiver listado, isso quer dizer que nenhum conjunto de itens atendeu aos critérios dos parâmetros do algoritmo. Nesse cenário, você poderá alterar os parâmetros do algoritmo para permitir que conjuntos de itens tenham um suporte inferior.
Para filtrar os conjuntos de itens mostrados no visualizador por nome
Clique na guia Conjuntos de Itens do visualizador.
Na caixa Filtrar Conjuntos de Itens, digite Pneu de Passeio e clique em um local fora da caixa.
O filtro retornará todos os itens que contêm essa cadeia de caracteres.
Na lista Mostrar, selecione Mostrar apenas nome de atributo.
Marque a caixa de seleção Mostrar nome longo.
A lista de conjuntos de itens é atualizada para mostrar somente os conjuntos de itens que contêm a cadeia de caracteres Pneu de Passeio. O nome longo do conjunto de itens inclui o nome da tabela que contém o atributo e o valor de cada item.
Desmarque a caixa de seleção Mostrar nome longo.
A lista de conjuntos de itens é atualizada para mostrar somente o nome curto.
Os valores da coluna Suporte indicam o número de transações para cada conjunto de itens. Uma transação para um conjunto de itens significa uma compra que incluiu todos os itens do conjunto de itens.
Por padrão, o visualizador lista os conjuntos de itens na ordem decrescente por suporte. Você pode clicar nos cabeçalhos das colunas para classificar por uma coluna diferente, como o tamanho ou o nome do conjunto de itens. Se você estiver interessado em aprender mais sobre as transações individuais incluídas em um conjunto de itens, poderá detalhar a partir dos conjuntos de itens para os casos individuais. As colunas de estrutura dos resultados do detalhamento são o nível de renda do cliente e a ID do cliente, que não foram usados no modelo.
Para exibir detalhes de um conjunto de itens.
Na lista de conjuntos de itens, clique no título da coluna Conjunto de Itens para classificar por nome.
Localize o item, Pneu de Passeio (sem um segundo item).
Clique com o botão direito do mouse no item, Pneu de Passeio, selecione Detalhar e Colunas do Modelo e da Estrutura.
A caixa de diálogo Detalhar exibirá as transações individuais usadas como suporte para esse conjunto de itens.
Expanda a tabela aninhada, vAssocSeqLineItems, para exibir a lista real de compras da transação.
Para filtrar conjuntos de itens por suporte ou tamanho
Limpe qualquer texto que possa estar na caixa Filtrar Conjunto de Itens. Não é possível usar um filtro de texto junto com um filtro numérico.
Na caixa Suporte mínimo, digite 100 e clique no plano de fundo do visualizador.
A lista de conjuntos de itens é atualizada para mostrar somente os conjuntos de itens com suporte de pelo menos 100.
Voltar ao Início
Guia Regras
A guia Regras exibe as informações a seguir relacionadas às regras que o algoritmo encontra.
**Probabilidade: **A probabilidade de uma regra, definida como a probabilidade do item do lado direito dado o item do lado esquerdo da regra.
**Importância: **a medida da utilidade de uma regra. Um valor maior significa uma regra melhor.
A importância é oferecida para ajudar você a indicar a utilidade de uma regra, porque a probabilidade apresentada de forma isolada pode ser falsa. Por exemplo, se todas as transações contiverem uma garrafa d'água -- talvez a garrafa d'água seja adicionada a cada carrinho automaticamente como parte de uma promoção -- o modelo criaria uma regra prevendo que a garrafa d'água teria uma probabilidade 1. Baseada somente na probabilidade, essa regra é bastante precisa, mas não oferece informações úteis.
**Regra: **a definição da regra. Para um modelo de cesta básica, uma regra descreve uma combinação específica de itens.
Cada regra pode ser usada para prever a presença de um item em uma transação com base na presença de outros itens. Assim como ocorre na guia Conjuntos de Itens, você pode filtrar as regras de forma que somente as mais interessantes sejam mostradas. Se você estiver trabalhando com um modelo de mineração que não tenha regras, talvez queira alterar os parâmetros do algoritmo para diminuir o limite de probabilidade para regras.
Para ver somente as regras que incluem a bicicleta Mountain-200
Na guia Visualizador do Modelo de Mineração, clique na guia Regras
Na caixa Filtrar Regra, digite Mountain-200.
Desmarque a caixa de seleção Mostrar nome longo.
Na lista Mostrar, selecione Mostrar apenas nome de atributo.
O visualizador só exibirá as regras que contêm as palavras "Mountain-200". A probabilidade da regra mostra a você o quanto é provável que quando alguém comprar uma bicicleta Mountain-200, também irá comprar o outro produto listado.
As regras são classificadas por probabilidade em ordem decrescente, mas você pode clicar nos títulos de coluna para alterar a ordem de classificação. Se você estiver interessado em descobrir mais detalhes sobre uma determinada regra, poderá usar o detalhamento para exibir os casos de suporte.
Para exibir casos que dão suporte a uma determinada regra
Na guia Regras, clique com o botão direito do mouse na regra que você deseja exibir.
Selecione Detalhar e Colunas do Modelo Somente ou Colunas do Modelo e da Estrutura.
A caixa de diálogo Detalhar oferece um resumo da regra na parte superior do painel e uma lista de todos os casos que foram usados como dados de suporte para a regra.
Voltar ao início
Visualizador de Árvore de Conteúdo Genérica
Esse visualizador pode ser usado em todos os modelos, independentemente do algoritmo ou do tipo de modelo. O Visualizador da Árvore de Conteúdo Genérico da Microsoft está disponível na lista suspensa Visualizador.
Uma árvore de conteúdo é uma representação de um modelo de mineração como uma série de nós, em que cada nó representa conhecimento adquirido sobre alguns subconjuntos de dados. O nó pode conter um padrão, um conjunto de regras, um cluster ou a definição de um intervalo de datas que compartilham características semelhantes. O conteúdo exato do nó difere segundo o algoritmo e o tipo do atributo previsível; no entanto, a representação geral do conteúdo é a mesma. É possível expandir os nós para consultar um maior número de detalhes, assim como copiar o conteúdo de qualquer um deles para a Área de Transferência.
Para exibir detalhes sobre a regra usando o visualizador de conteúdo
Na guia Visualizador do Modelo de Mineração, selecione Visualizador de Árvore de Conteúdo Genérica da Microsoft na lista Visualizador.
No painel Legenda de Nó, navegue até a parte inferior da lista e clique no último nó.
O visualizador mostra conjuntos de itens primeiro e regras em seguida, mas não os agrupa. O modo mais fácil de localizar um nó específico é criar uma consulta de conteúdo. Para obter mais informações, consulte Consultando um modelo de associação (Analysis Services - Mineração de dados).
No painel Detalhes do Nó, revise o valor de NODE_TYPE e NODE_DESCRIPTION.
Um tipo de nó 8 é uma regra e um tipo de nó 7 é um conjunto de itens. Para uma regra, o valor de NODE_DESCRIPTION mostra as condições que compõem a regra. Para conjunto de itens, o valor de NODE_DESCRIPTION mostra os itens incluídos no conjunto de itens.
Você também pode criar uma consulta de conteúdo para obter estatísticas detalhadas sobre as regras. Para obter mais informações sobre o modelo de mineração e sobre como interpretá-lo, consulte Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de Dados).
Voltar ao início
Próxima tarefa na lição
Consulte também