Partilhar via


Lição 1: Criando a estrutura de mineração de Comprador de Bicicleta

Nesta lição, você criará uma estrutura de mineração que permite prever se um cliente potencial da Adventure Works Cycles comprará uma bicicleta. Se você não estiver familiarizado com estruturas de mineração e sua função na mineração de dados, consulte Estruturas de mineração (Analysis Services – Mineração de Dados).

A estrutura de mineração Bike Buyer que você criará nesta lição dá suporte à adição de modelos de mineração com base no Algoritmo de Clustering microsoft Algoritmo Árvores de Decisão da Microsoft. Em lições posteriores, você usará os modelos de mineração de clustering para explorar as várias maneiras nas quais os clientes podem ser agrupados e usará os modelos de mineração da árvore de decisão para prever se um cliente potencial comprará ou não uma bicicleta.

Instrução CREATE MINING STRUCTURE

Para criar uma estrutura de mineração, use a instrução CREATE MINING STRUCTURE (DMX ). O código na instrução pode ser dividido nas seguintes partes:

  • Nomeando a estrutura.

  • Definindo a coluna de chave.

  • Definindo as colunas de mineração.

  • Definindo um conjunto de dados de teste opcional.

A seguir, veja um exemplo genérico da instrução CREATE MINING STRUCTURE:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

A primeira linha do código define o nome da estrutura:

CREATE MINING STRUCTURE [<mining structure name>]  

Para obter informações sobre como nomear um objeto em DMX (Data Mining Extensions), consulte Identificadores (DMX).

A próxima linha do código define a coluna de chave da estrutura de mineração, que identifica exclusivamente uma entidade nos dados de origem:

<key column>,  

Na estrutura de mineração que você criará, o identificador do cliente, CustomerKey, define uma entidade nos dados de origem.

A próxima linha do código define as colunas de mineração que serão usadas pelos modelos de mineração associados à estrutura de mineração.

<mining structure columns>  

Você pode usar a função DISCRETIZE em <colunas> de estrutura de mineração para diferenciar colunas contínuas usando a seguinte sintaxe:

DISCRETIZE(<method>,<number of buckets>)

Para obter mais informações sobre como diferenciar colunas, consulte Métodos de discretização (mineração de dados). Para obter mais informações sobre os tipos de colunas de estrutura de mineração que você pode definir, consulte Colunas de estrutura de mineração.

A última linha do código define uma partição opcional na estrutura de mineração:

WITH HOLDOUT (<holdout specifier>)  

Você especifica parte dos dados a serem usados no teste dos modelos de mineração relacionados com a estrutura, e os demais dados serão usados para treinamento dos modelos. Por padrão, o Analysis Services cria um conjunto de dados de teste que contém 30% de todos os dados de caso. Você adicionará a especificação de que o conjunto de dados de teste deve conter 30% dos casos até o máximo de 1000 casos. Se 30% dos casos for inferior a 1000, o conjunto de dados de teste terá uma quantidade menor.

Tarefas da lição

Você executará as seguintes tarefas nesta lição:

  • Criar uma nova consulta em branco.

  • Alterar a consulta para criar a estrutura de mineração.

  • Executar a consulta.

Criando a consulta

A primeira etapa é conectar-se a uma instância do Analysis Services e criar uma nova consulta DMX no SQL Server Management Studio.

Para criar uma nova consulta DMX no SQL Server Management Studio

  1. Abra o SQL Server Management Studio.

  2. Na caixa de diálogo Conectar ao Servidor , em Tipo de servidor, selecione Analysis Services. Em Nome do servidor, digite LocalHostou digite o nome da instância do Analysis Services à qual você deseja se conectar para esta lição. Clique em Conectar.

  3. Em Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX para abrir o Editor de Consultas e uma nova consulta em branco.

Alterando a consulta

A próxima etapa é modificar a instrução CREATE MINING STRUCTURE descrita acima para criar a estrutura de mineração de Comprador de Bicicleta.

Para personalizar a instrução CREATE MINING STRUCTURE.

  1. No Editor de Consultas, copie o exemplo genérico da instrução CREATE MINING STRUCTURE na consulta em branco.

  2. Substitua o seguinte:

    [<mining structure>]   
    

    por:

    [Bike Buyer]  
    
  3. Substitua o seguinte:

    <key column>   
    

    por:

    CustomerKey LONG KEY  
    
  4. Substitua o seguinte:

    <mining structure columns>   
    

    por:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. Substitua o seguinte:

    WITH HOLDOUT (holdout specifier>)  
    

    por:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    A instrução completa da estrutura de mineração agora deve ser:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
    
  6. No menu Arquivo , clique em Salvar DMXQuery1.dmx As.

  7. Na caixa de diálogo Salvar como , navegue até a pasta apropriada e nomeie o arquivo Bike Buyer Structure.dmx.

Executando a consulta

A última etapa é executar a consulta. Depois que uma consulta é criada e salva, ela precisa ser executada. Ou seja, a instrução precisa ser executada para criar a estrutura de mineração no servidor. Para obter mais informações sobre como executar consultas em Editor de Consultas, consulte Editor de Consultas do Mecanismo de Banco de Dados (SQL Server Management Studio).

Para executar a consulta.

  1. Em Editor de Consultas, na barra de ferramentas, clique em Executar.

    O status da consulta é exibido na guia Mensagens na parte inferior do Editor de Consultas após a conclusão da execução da instrução. As mensagens devem exibir:

    Executing the query   
    Execution complete  
    

    Uma nova estrutura chamada Bike Buyer agora existe no servidor.

Na próxima lição, você adicionará modelos de mineração à estrutura que acaba de criar.

Próxima lição

Lição 2: Adicionando modelos de mineração à estrutura de mineração de Comprador de Bicicleta