Partilhar via


Assistente para Associação (Cliente de Mineração de Dados para Excel)

Assistente de associação na faixa de opções de Mineração de Dados

O assistente Associar ajuda você a criar um modelo de mineração de dados usando o algoritmo Regras de Associação da Microsoft. Esses modelos de mineração são particularmente úteis para criar sistemas de recomendação.

Como funciona é que o algoritmo Regras de Associação da Microsoft examina um conjunto de dados composto por transações ou eventos e localiza as combinações que aparecem frequentemente juntas. Pode haver milhares de combinações, mas o algoritmo pode ser personalizado para obter mais ou menos, e para reter apenas as combinações mais prováveis.

Você pode aplicar a análise da associação a vários problemas. A aplicação mais popular desse método é a análise da cesta de compras, que localiza produtos individuais que são geralmente comprados juntos. Você pode usar essas informações para recomendar produtos para os clientes com base nos itens que eles já compraram.

Usando o Assistente para Associação

  1. Na faixa de opções Mineração de Dados , clique em Associar.

  2. Na página Selecionar Dados de Origem , escolha uma tabela ou intervalo de dados do Excel e clique em Avançar.

    A pasta de trabalho de dados de exemplo contém um exemplo, na guia Associar, de como os dados da transação são normalmente organizados se, por exemplo, você tem vários produtos em cada transação ou vários registros de compra por cliente que você quer analisar.

    Se você quiser usar dados externos para criar um modelo de associação usando o assistente Associar, deverá adicionar os dados ao Excel primeiro e nivelar os dados. Para obter mais informações sobre como preparar dados para modelagem de associação, consulte Tabelas Aninhadas (Analysis Services – Mineração de Dados), em SQL Server Manuais Online.

  3. Na página Associação , escolha a coluna que identifica a transação.

    Para modelos da cesta de compras, esse identificador representa a unidade que você deseja modelar. Você deseja analisar os itens individuais que os clientes compraram ao longo do tempo ou deseja analisar muitas transações que envolvem vários clientes? No primeiro caso, você escolheria a ID do cliente; no último, você escolheria a ordem de compra ou outra ID da transação

  4. Em Item, selecione a coluna que contém as coisas entre as quais você precisa encontrar associações.

    Por exemplo, em um modelo de cesta de compras, você escolheria um campo de produtos, para analisar quais produtos são geralmente comprados juntos. Se houver muitos produtos individuais para correlacionar com eficiência, você poderá escolher um campo de categoria ou subcategoria de produto.

  5. Em Limites, você pode definir valores que controlam ou afetam a saída do modelo:

    • Suporte mínimo. Especifica quantas vezes um grupo de itens deve aparecer para ser considerado importante. O algoritmo ignorará todas as combinações de itens que não satisfaçam esse critério. Por exemplo, você pode querer ver apenas os conjuntos de itens que aparecem juntos pelo menos 10 vezes no total.

    • Probabilidade de regra mínima. Especifica o valor da probabilidade mínima exigida para uma regra ser salva. O conjunto de dados inteiro é analisado para localizar todas as combinações e, em seguida, a probabilidade é calculada. Se o limite for baixo, o assistente poderá associar os itens que tiverem apenas pouca correlação. Se o limite for muito alto, algumas associações poderão ser omitidas porque não tem dados de suporte suficientes.

    Em geral, alterar esses valores tem os seguintes efeitos:

    • À medida que você reduz o valor do suporte, aumenta o número de combinações encontradas.

    • À medida que você diminui o suporte máximo, filtra os itens que ocorrem com tanta frequência que significam muito pouco.

    • À medida que você reduz a probabilidade de uma regra, diminui os requisitos que uma combinação precisa atender para ser considerara importante no contexto do conjunto de dados total.

    Ponta: É uma boa ideia criar vários modelos de mineração usando diferentes combinações de suporte e probabilidade. Para acompanhar quais configurações você usou para cada modelo, use o assistente modelo de documento , disponível no Cliente de Mineração de Dados para Excel e use a opção Relatório detalhado . Para obter mais informações, consulte Documentando modelos de mineração (suplementos de mineração de dados para Excel).

  6. Opcionalmente, clique em Parâmetros para alterar os parâmetros de algoritmo e personalizar o comportamento do modelo de mineração.

    A caixa de diálogo Parâmetros de Algoritmo inclui todos os parâmetros que você define no assistente, mais alguns que são usados com menor frequência, como MAXIMUM_SUPPORT. Para obter informações sobre como usar esses parâmetros, consulte Referência técnica do algoritmo de associação da Microsoft.

  7. Na página Concluir , digite um nome exclusivo para o conjunto de dados e o modelo.

  8. Em Opções, você define como deseja trabalhar com o modelo depois que ele for concluído:

    • Navegue. Quando o modelo já estiver criado, o assistente abre uma janela que exibe as regras, os conjuntos de itens e um gráfico de rede de dependências que representa as associações.

      Para obter mais informações sobre como interpretar os dados no visualizador de modelo de associação, consulte Navegação em um modelo de regras de associação.

    • Habilitar o detalhamento. Selecione esta opção para obter acesso aos dados subjacentes, por meio do modelo.

      O detalhamento é útil, por exemplo, se você quiser clicar em um determinado conjunto de itens e ver os dados de origem.

    • Use o modelo temporário. Selecione esta opção se você não quiser que o modelo seja salvo no servidor. Os modelos temporários serão excluídos quando você fechar o Excel.

  9. O assistente analisa todas as combinações possíveis e cria um relatório que contém os conjuntos de itens e as regras.

Mais sobre modelos de associação

O algoritmo Regras de Associação da Microsoft examina os dados de treinamento para localizar itens que aparecem juntos em uma transação. Cada grupo de itens constitui um conjunto de itens. Em seguida, o algoritmo conta o número de vezes que cada conjunto de itens aparece e calcula a importância relativa de cada conjunto de itens em todas as transações.

O algoritmo usa essas informações sobre conjuntos de itens para gerar regras que podem ser usadas para prever associações ou fazer recomendações. Por exemplo, uma regra pode ser "se o usuário comprou um livro do Autor 1 e um livro do Autor 2, provavelmente também comprará um livro do Autor 3". Cada recomendação recebe uma probabilidade, com base na intensidade das associações.

Requisitos

Para usar o assistente Associado, você deve estar conectado a um banco de dados do Analysis Services.

A fonte de dados deve estar organizada como uma tabela de transação. A fonte de dados deve conter uma coluna com o identificador da transação. Essa coluna identifica cada grupo de itens. Essa coluna de transação deve estar em uma relação um-para-muitos com a segunda coluna, a ID do item, que armazena nomes ou números de ID para os itens individuais no grupo.

Em tese, isso talvez seja mais fácil entender isso relembrando o exemplo do carrinho de compras. Se o carrinho de compras tiver uma ID, essa ID servirá como identificador da transação. Cada item no carrinho de compras, como batatas ou leite, é membro dessa transação. O algoritmo Associação pode rastrear os itens nas transações: por exemplo, para determinar quantas vezes batatas e leite aparecem em qualquer transação única.

A fonte de dados deve ser classificada pela coluna de identificador da transação.

Consulte Também

Criar um modelo de mineração de dados
Procurando um modelo de regras de associação
Análise da Cesta de Compras (Ferramentas de Análise de Tabela para Excel)
Passo a passo do diagrama de rede de dependências (Suplementos de Mineração de Dados)