Lição 4: Explorando modelos de mineração Comprador de Bicicleta
Nesta lição, você usará a instrução SELECT (DMX) para explorar o conteúdo na árvore de decisão e clustering modelos de mineração criados na Lição 2: adicionando modelos de mineração à estrutura de mineração preditiva.
As colunas contidas em um modelo de mineração não são as colunas definidas pela estrutura de mineração. Ao contrário, constituem um conjunto específico de colunas que descrevem as tendências e os padrões encontrados pelo algoritmo. Essas colunas de modelo de mineração são descritas no conjunto de linhas do esquema do conjunto de linhas DMSCHEMA_MINING_MODEL_CONTENT . Por exemplo, a coluna de MODEL_NAME no conjunto de linhas de esquema de conteúdo traz o nome do modelo de mineração. Para um modelo de mineração de clustering, a coluna de NODE_CAPTION contém o nome de cada cluster e a coluna NODE_DESCRIPTION contém a descrição das características de cada cluster. Você pode procurar essas colunas usando o modelo> SELECT FROM<. Instrução CONTENT no DMX. Também pode usar essa instrução para explorar os dados usados para criar o modelo de mineração. O uso dessa instrução requer que as análises sejam habilitadas na estrutura de mineração. Para obter mais informações sobre a instrução, consulte SELECT FROM <model>. CASOS (DMX).
Você também pode retornar todos os estados de uma coluna discreta usando a instrução SELECT DISTINCT. Por exemplo, se você executar esta operação na coluna gênero, a consulta retornará male
e female
.
Tarefas da lição
Você executará as seguintes tarefas nesta lição:
Explore o conteúdo inserido nos modelos de mineração.
Retorne as ocorrências dos dados de origem usadas para fazer um treinamento com os modelos de mineração
Explore os diferentes estados disponíveis de uma coluna discreta específica
Retornando o conteúdo de um modelo de mineração
Nesta lição, você usará o modelo> SELECT FROM<. Instrução CONTENT (DMX) para retornar o conteúdo do modelo clustering.
Veja a seguir um exemplo genérico do modelo> SELECT FROM<. Instrução CONTENT:
SELECT <select list> FROM [<mining model>].CONTENT
WHERE <where clause>
A primeira linha do código define que as colunas retornem do conteúdo do modelo de mineração e do modelo de mineração com as quais estão associadas:
SELECT <select list> FROM [<mining model].CONTENT
A cláusula .CONTENT, próxima ao nome do modelo de mineração, determina que você está retornando conteúdo do modelo de mineração. Para obter mais informações sobre as colunas contidas no modelo de mineração, consulte DMSCHEMA_MINING_MODEL_CONTENT Conjunto de linhas.
Você pode optar por usar a linha final do código para filtrar os resultados retornados pela instrução:
WHERE <where clause>
Por exemplo, se você quiser restringir os resultados da consulta apenas aos clusters que contêm um número elevado de ocorrências, você poderá adicionar a cláusula WHERE à instrução SELECT:
WHERE NODE_SUPPORT > 100
Para obter mais informações sobre como usar a instrução WHERE, consulte SELECT (DMX).
Para retornar o conteúdo do modelo de mineração de clustering
Em Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX.
O Editor de Consultas é exibido com uma consulta nova em branco.
Copie o exemplo genérico do modelo> SELECT FROM<. Instrução CONTENT na consulta em branco.
Substitua o seguinte:
<select list>
por:
*
Você também pode substituir * por uma lista de qualquer uma das colunas contidas no conjunto de linhas DMSCHEMA_MINING_MODEL_CONTENT.
Substitua o seguinte:
[<mining model>]
por:
[Clustering]
A instrução completa agora deve ser:
SELECT * FROM [Clustering].CONTENT
No menu Arquivo , clique em Salvar DMXQuery1.dmx Como.
Na caixa de diálogo Salvar como , navegue até a pasta apropriada e nomeie o arquivo
SELECT_CONTENT.dmx
.Na barra de ferramentas, clique no botão Executar .
A consulta retorna o conteúdo de um modelo de mineração.
Use a análise
O próximo passo é usar a instrução de análise para retornar uma amostragem dos casos usados para treinar o modelo de mineração de árvore de decisão. Nesta lição, você usará o modelo> SELECT FROM<. Instrução CASES (DMX) para retornar o conteúdo do modelo de árvore de decisão.
Veja a seguir um exemplo genérico do modelo> SELECT FROM<. Instrução CASES:
SELECT <select list>
FROM [<mining model>].CASES
WHERE IsInNode('<node id>')
A primeira linha do código define que as colunas retornem dos dados de origem, e do modelo de mineração a que pertencem:
SELECT <select list> FROM [<mining model>].CASES
A cláusula .CASES especifica que você está executando uma consulta para análise. Para usar o detalhamento, você deve habilitá-lo durante a criação do modelo de mineração.
A linha final do código é opcional e especifica o nó no modelo de mineração do qual você está solicitando os casos:
WHERE IsInNode('<node id>')
Para obter mais informações sobre como usar a instrução WHERE com IsInNode, consulte SELECT FROM <model>. CASOS (DMX).
Para retornar os casos usados para treinar o modelo de mineração
Em Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX.
O Editor de Consultas é exibido com uma consulta nova em branco.
Copie o exemplo genérico do modelo> SELECT FROM<. Instrução CASES na consulta em branco.
Substitua o seguinte:
<select list>
por:
*
Você também pode substituir * por qualquer lista de colunas presente nos dados de origem (como [Comprador de Bicicleta]).
Substitua o seguinte:
[<mining model>]
por:
[Decision Tree]
A instrução completa agora deve ser:
SELECT * FROM [Decision Tree].CASES
No menu Arquivo , clique em Salvar DMXQuery1.dmx Como.
Na caixa de diálogo Salvar como , navegue até a pasta apropriada e nomeie o arquivo
SELECT_DRILLTHROUGH.dmx
.Na barra de ferramentas, clique no botão Executar .
A consulta retorna os dados de origem que foram usados para treinar os modelos de mineração da árvore de decisão.
Retorne os estados de uma coluna discreta do modelo de mineração
O próximo passo é usar a instrução SELECT DISTINCT para retornar possíveis estados diferentes na coluna de modelo de mineração especificada.
Segue um exemplo genérico da instrução SELECT DISTINCT:
SELECT DISTINCT [<column>]
FROM [<mining model>]
A primeira linha do código define as colunas do modelo de mineração para as quais os estados retornam:
SELECT DISTINCT [<column>]
Você deve incluir DISTINCT para retornar todos os estados da coluna. Se você excluir DISTINCT, então a instrução toda se tornará um atalho para uma previsão e retornará o estado mais provável da coluna especificada. Para obter mais informações, confira SELECT (DMX).
Para retornar os estados de uma coluna discreta
Em Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX.
O Editor de Consultas é exibido com uma consulta nova em branco.
Copie o exemplo genérico da instrução SELECT Distinct, no campo em branco da consulta.
Substitua o seguinte:
[<column,name>
por:
[Bike Buyer]
Substitua o seguinte:
[<mining model>]
por:
[Decision Tree]
A instrução completa agora deve ser:
SELECT DISTINCT [Bike Buyer] FROM [Decision Tree]
No menu Arquivo , clique em Salvar DMXQuery1.dmx Como.
Na caixa de diálogo Salvar como , navegue até a pasta apropriada e nomeie o arquivo
SELECT_DISCRETE.dmx
.Na barra de ferramentas, clique no botão Executar .
A consulta retorna os estados possíveis da coluna Comprador de Bicicleta.
Na próxima lição, você poderá prever se os clientes potenciais serão os compradores de bicicleta usando o modelo de mineração da árvore de decisão.