Partilhar via


Tutorial de mineração de dados básico

Bem-vindo ao Tutorial básico de mineração de dados do Microsoft Analysis Services. O Microsoft SQL Server fornece um ambiente integrado para criar modelos de mineração de dados e fazer previsões. Neste tutorial, você concluirá um cenário para uma campanha de mala direta na qual usará o aprendizado automatizado para analisar e prever o comportamento de compra do cliente. O tutorial demonstra como usar três dos algoritmos de mineração de dados mais importantes: clustering, árvores de decisão, e Naive Bayes. Você também aprenderá a analisar suas descobertas usando os visualizadores de modelo de mineração e a criar previsões e gráficos de precisão usando as ferramentas de mineração de dados incluídas no Microsoft SQL Server Analysis Services. A empresa fictícia, Adventure Works Cycles, é usada para todos os exemplos.

Quando estiver confortável usando as ferramentas de mineração de dados, recomendamos que você também conclua o Tutorial de Mineração de Dados Intermediário (Analysis Services – Mineração de Dados). As lições demonstram como usar previsão, análise da cesta de compras, série temporal, modelos de associação, tabelas aninhadas, e clustering de sequência.

Cenário do tutorial

Neste tutorial, você é um funcionário da Adventure Works Cycles que foi encarregado de aprender mais sobre os clientes da empresa com base em compras históricas e, em seguida, usar esses dados históricos para fazer previsões que podem ser usadas no marketing. A empresa nunca tinha realizado a mineração de dados antes, por isso você deve criar um novo banco de dados especificamente para a mineração de dados e definir vários modelos de mineração.

O que você aprenderá

Este tutorial ensina como criar e trabalhar com vários tipos diferentes de métodos automatizados de aprendizado. Você também aprenderá como criar uma cópia de um modelo de mineração, e aplicar um filtro aos dados de entrada para obter resultados diferentes. Depois, você poderá comparar os resultados de ambos os modelos, usando um gráfico de comparação de precisão. Por fim, você usará o detalhamento para recuperar dados adicionais da estrutura de mineração subjacente.

A Mineração de Dados do Microsoft Analysis Services inclui os seguintes recursos que ajudam você a desenvolver e comparar com facilidade vários modelos preditivos e, em seguida, executar ações sobre os resultados:

  • Conjuntos de Testes de Controle -ao criar uma estrutura de mineração, você poderá dividir os dados na estrutura de mineração em conjuntos de treinamento e teste. Isso permite testar modelos em conjuntos de dados semelhantes e comparar a exatidão de modelos relacionados.

  • Filtros de modelo de mineração -agora é possível anexar filtros a um modelo de mineração e aplicá-lo durante o treinamento e o teste. Isso permite criar facilmente modelos relacionados em diferentes subconjuntos dos dados.

  • Detalhamento para casos de estrutura e colunas de estrutura - agora você pode se mover facilmente dos padrões gerais do modelo de mineração para detalhes acionáveis na fonte de dados.

Ele se divide nas lições a seguir:

Lição 1: Preparando o banco de dados do Analysis Services (Tutorial de mineração de dados básico)
Nesta lição, você aprenderá a criar um novo banco de dados do Analysis Services, adicionar uma fonte de dados e uma exibição de fonte de dados e preparar o novo banco de dados a ser usado com a mineração de dados.

Lição 2: Criando uma estrutura de mala direta (Tutorial de mineração de dados básico)
Nesta lição, você aprenderá a criar uma estrutura de modelo de mineração que poderá ser usada como parte de um cenário de mala direta.

Lição 3: Adicionando e processando modelos
Nesta lição, você aprenderá a adicionar modelos a uma estrutura. Os modelos criados por você serão desenvolvidos com os seguintes algoritmos:

  • Árvores de Decisão da Microsoft

  • Microsoft Clustering

  • Microsoft Naive Bayes

Lição 4: Explorando os modelos de mala direta (Tutorial de mineração de dados básico)
Nesta lição, você aprenderá a explorar e a interpretar as descobertas de cada modelo usando os Visualizadores.

Lição 5: Testando modelos (Tutorial de mineração de dados básico)
Nesta lição, você fará uma cópia de um dos modelos de mala direta, adicionará um filtro de modelo de mineração para restringir os dados de treinamento a um determinado conjunto de clientes e avaliará a viabilidade do modelo.

Lição 6: Criando e trabalhando com previsões (Tutorial de mineração de dados básico)
Na última lição do Tutorial de mineração de dados básico, você usará o modelo para prever que clientes têm mais probabilidade de comprar uma bicicleta. Em seguida, você detalhará os casos subjacentes para obter informações de contato.

Requisitos

Verifique se os seguintes itens estão instalados:

  • Microsoft SQL Server 2014

  • Microsoft SQL Server Analysis Services no modo multidimensional

  • O banco de dados AdventureWorksDW2012 .

Para aprimorar a segurança, os bancos de dados de exemplo não são instalados com SQL Server. Para instalar os bancos de dados oficiais do Microsoft SQL Server, visite a página Bancos de Dados de Exemplo do Microsoft SQL e selecione SQL Server 2014.

Observação

Ao trabalhar com um tutorial, talvez você ache mais fácil ir e voltar entre as etapas se adicionar os botões Próximo tópico e Tópico anterior à barra de ferramentas do visualizador de documentos.

Consulte Também

Soluções de mineração de dados
Tarefas e instruções do modelo de mineração
Criando e consultando modelos de mineração de dados com DMX: Tutoriais (Analysis Services – Mineração de dados)