Udostępnij za pośrednictwem


Data Mining utilizando o Excel – Influenciadores

Apesar de não ser um recurso novo, sempre que mostro o Add-in do Analysis Services para o Excel as pessoas ficam espantadas com os recursos de Data Mining. Visto isso, resolvi mostrar os principais recursos.

O que estou utilizando é o Analysis Services do SQL Server 2008 e baixei o add-in disponível no site da Microsoft.

Junto com o Add-in vem uma planilha Excel de exemplo, e é esta planilha que vou utilizar nesse post. A idéia ter dentro do Excel dados na forma de uma tabela (uma listagem simples) e trabalhar essas informações utilizando o engine do SQL Server Analysis Services (SSAS) para auxiliar na tarefa de analisar e entender seus dados.

Num cenário real, você poderia gerar essa tabela fazendo uma simples listagem dos seus dados utilizando o Reporting Services (por exemplo). Nos dados de exemplo, o cenário é o do famoso AdventureWorks, onde temos uma empresa (fictícia) que vende, entre outras coisas, bicicletas.

O primeiro recurso que quero mostrar é o de análise de influenciadores. A idéia é utilizar o SSAS para identificar quais fatores influenciam a venda de bicicletas. Para isso vou utilizar uma das listagens existentes no exemplo, onde eu tenho os dados dos clientes da AdventureWorks conforme a imagem abaixo.

Excel1

Notem que a última coluna indica se aquele cliente comprou uma bicicleta. Então o que irá acontecer é que, utilizando essa coluna, o Excel (utilizando o SSAS) vai identificar quais das informações contidas nas demais colunas influenciam positiva e negativamente a compra de bicicletas.

Para fazer isso basta que, após ter selecionado qualquer parte da tabela (listagem), eu vá na opção “Analyse Key Influencers”.

excel2

Agora o que você precisa fazer é escolher qual informação vai ser analisada (no nosso caso a venda de bicicletas).

excel3

Após os cálculos do SSAS, é gerada uma nova planilha onde são revelados (baseado nos dados da tabela que utilizamos) quais são os influenciadores positivos e negativos na venda de bicicletas

excel4

Então de uma forma muito simples, é possível entender a relação dos dados e entender os influenciadores. Vale lembrar que os dados que utilizei aqui não são reais, então provavelmente resultado que obtive não deve ser levado em consideração caso você esteja pensando em vender bicicletas.

Logo vou fazer outros posts com os outros recursos de mineração de dados utilizando o Excel.

[]s

Alex Schulz

Comments

  • Anonymous
    February 16, 2009
    Alex, gostaria de disparar esse processo via código, apresentando para o cliente a planilha já com os dados influenciadores... tem como?Abraço!
  • Anonymous
    February 17, 2009
    Alexandre,pra fazer isso, acredito que seja necessário criar uma aplicação OBA (office business application) na qual você pega os dados e chama, programaticamente o Analysis server, para rodar o algoritmo de data mining.No MSDN tem a documentação do ADOMD (Framework .Net para comunicação com o Analysis Server): http://msdn.microsoft.com/pt-br/library/ms123483.aspx.Não tenho nada pronto pra te passar sobre isso, mas acho que é um bom assunto para um novo post.[]s