Partilhar via


Criando um modelo de mineração de dados

A modelagem de dados é a etapa da mineração de dados em que você cria padrões e tendências aplicando algoritmos aos dados. Posteriormente, você poderá usar esses padrões para análise ou para fazer previsões.

Os Suplementos de Mineração de Dados para Office oferecem suporte a mineração de dados por meio de assistentes que facilitam a criação de modelos. Os assistentes analisam os dados, identificam correlações, calculam o significado estatístico de todas as variáveis e selecionam automaticamente o melhor modelo.

Embora essa funcionalidade seja tão poderosa quanto as ferramentas de mineração de dados fornecidas pelo SQL Server Analysis Services e SQL Server Data Tools (SSDT), a combinação de assistentes e a interface conhecida do Excel facilita a criação, modificação e uso da mineração de dados.

Avançados (mineração de dados)

Os assistentes Avançados permitem criar novos modelos de mineração de dados, com base em dados armazenados no Excel, usando um dos algoritmos de mineração de dados em SQL Server Analysis Services.

Criar a Estrutura de Mineração

O Assistente para Criar Estrutura de Mineração o ajuda a criar uma nova estrutura de mineração de dados, que você pode usar como a base para vários modelos de mineração. O assistente lhe oferece a opção de separar parte dos dados para usar como um conjunto de testes, para que você possa avaliar todos os modelos que utilizam os mesmos dados de acordo com um padrão de teste consistente.

Criar estrutura de mineração (Suplementos de Mineração de Dados do SQL Server)

Adicionar modelo à estrutura

O assistente para Adicionar Modelo à Estrutura lhe permite escolher uma estrutura de mineração de dados existente e criar um novo modelo de mineração de dados para ela. Você pode adicionar vários modelos de mineração a uma estrutura, alterar os parâmetros ou escolher algoritmos de mineração de dados diferentes e personalizar a saída.

Adicionar modelo à estrutura (Suplementos de Mineração de Dados para Excel)

Analisar os Influenciadores Principais (Analisar)

Você escolhe uma coluna ou um valor de saída e então o algoritmo analisa todos os dados de saída para identificar os fatores com mais influência no destino. Opcionalmente, você pode criar um relatório que compara quaisquer dois valores, de forma que você possa ver como os influenciadores são alterados.

A ferramenta Analisar Principais Influenciadores usa o algoritmo Microsoft Naïve Bayes.

Analisar os Influenciadores Principais (Ferramentas de Análise de Tabela para Excel)

Associação (mineração de dados)

O assistente Associar cria um modelo de associação que detecta associações entre itens que aparecem em várias transações: por exemplo, na análise de cesta de compras.

Assistente para Associação (Cliente de Mineração de Dados para Excel)

Classificar (mineração de dados)

O assistente Classificar cria um modelo de classificação que analisa os fatores que contribuíram para um resultado de destino. Você pode usar vários algoritmos com este assistente, incluindo Árvores de Decisão, Naïve Bayes e Redes Neurais.

Assistente de Classificação (Suplementos de Mineração de Dados para Excel)

Cluster (mineração de dados)

O Assistente de cluster cria um modelo de clustering que detecta grupos de linhas que compartilham características semelhantes. O clustering (às vezes chamado de segmentação) é uma técnica de aprendizado não supervisionado que é muito útil ao tentar entender padrões e agrupamentos em novos dados.

O algoritmo Clustering da Microsoft dá suporte a diversas variedades do clustering K-means e de Maximização de expectativa (EM).

Assistente de Cluster (Suplementos de Mineração de Dados para Excel).

Detectar categorias (Analisar)

A ferramenta Detectar Categorias permite adicionar qualquer conjunto de dados e aplicar clustering para localizar agrupamentos de dados. É útil para localizar semelhanças e criar grupos para analisar mais detalhadamente.

A ferramenta Detectar Categorias usa o algoritmo Clustering da Microsoft.

Detectar Categorias (Ferramentas de Análise de Tabela para Excel)

Estimar (mineração de dados)

O assistente para Estimar cria um modelo de estimativa que extrai padrões de dados e usa esses padrões para prever valores numéricos contínuos, de data ou de hora. Ele usa o algoritmo Árvores de Decisão da Microsoft.

Assistente de Estimativa (Suplementos de Mineração de Dados para Excel)

Preencher com Base no Exemplo (Analisar)

A ferramenta Preencher do Exemplo ajuda você a imputar valores ausentes. Você fornece alguns exemplos de como deverão ser os valores ausentes e a ferramenta cria padrões com base em todos os dados da tabela, e então recomenda novos valores com base em padrões dos dados.

A ferramenta Preencher do Exemplo usa o algoritmo Regressão Logística da Microsoft.

Preencher com Base no Exemplo (Ferramentas de Análise de Tabela para Excel)

Previsão (Analisar)

A ferramenta Previsão usa dados que mudam ao longo do tempo e prevê valores futuros.

A ferramenta Previsão usa o algoritmo Microsoft Time Series.

Previsão (Ferramentas de Análise de Tabela para Excel)

Previsão (mineração de dados)

O assistente de previsão cria um modelo de previsão que detecta padrões em uma série de células e, em seguida, prevê valores adicionais.

Assistente de Previsão (Suplementos de Mineração de Dados para Excel)

Realçar Exceções (Analisar)

A ferramenta Realçar Exceções analisa padrões em uma tabela de dados e localiza linhas e valores que não se ajustam ao padrão. Então, você poderá examiná-los e corrigi-los e executar o modelo novamente, ou sinalizar valores para ação posterior.

A ferramenta Realçar Exceções usa o algoritmo Microsoft Clustering.

Realçar Exceções (Ferramentas de Análise de Tabela para Excel)

Cálculo de Previsão (Analisar)

Essa ferramenta cria um modelo que analisa os fatores que levam a resultados de destino e então prevê um resultado para qualquer nova entrada, com base em critérios derivados desses padrões. Também gera uma planilha de tomada de decisão interativa que permite a você a criar pontuação de novas entradas com facilidade. Você também pode criar uma versão impressa da planilha de pontuação para uso offline.

A ferramenta Calculadora de Previsão usa o algoritmo Regressão Logística da Microsoft.

Cálculo de Previsão (Ferramentas de Análise de Tabela para Excel)

Cenário: Metas a Atingir (Analisar)

Na ferramenta Busca de Meta , você especifica um valor de destino e a ferramenta identifica os fatores subjacentes que devem ser alterados para atender a esse destino. Por exemplo, se você sabe que deve aumentar a satisfação da chamada em 20%, poderá solicitar ao modelo que preveja os fatores que devem mudar para que essa meta seja produzida.

A ferramenta Busca de Meta usa o algoritmo Regressão Logística da Microsoft.

detalhes

Cenário de Metas a Atingir (Ferramentas de Análise de Tabela para Excel)

Cenário: cenário E-Se (Analisar)

A ferramenta What-If Analysis complementa a ferramenta Busca de Meta . Com essa ferramenta, você inseriu o valor que deseja alterar, e o modelo prevê se essa alteração será suficiente para obtenção do resultado desejado. Por exemplo, você poderia perguntar ao modelo para inferir se a adição de um operador de chamada extra poderia aumentar a satisfação do cliente em um ponto.

A ferramenta What-If usa o algoritmo Regressão Logística da Microsoft.

Cenário E-Se (Ferramentas de Análise de Tabela para Excel)

Análise da Cesta de Compras (Analisar)

A ferramenta análise de cesta de compras cria grupos de produtos que são frequentemente comprados juntos, para identificar padrões que podem ser usados em venda cruzada ou vendas. Também gera relatórios com base no preço e no custo de pacotes de produto relacionados, para auxiliar a tomada de decisão.

Você também pode usar essa ferramenta para eventos que ocorrem juntos com frequência, fatores que levam a um diagnóstico ou qualquer outro conjunto de causas e resultados potenciais.

A ferramenta de Análise de Cesta de Compras usa o algoritmo Associação da Microsoft.

Análise da Cesta de Compras (Ferramentas de Análise de Tabela para Excel)

Consulte Também

Explorando e limpando dados
Validando modelos e usando modelos para previsão (suplementos de mineração de dados para Excel)
Implantando e dimensionando modelos de mineração (Suplementos de Mineração de Dados para Excel)