Artigo
04/01/2012

Criando previsões em um modelo de cluster de sequências (Tutorial de mineração de dados intermediário)

Depois de compreender melhor o modelo de clustering de sequências ao navegar por ele no visualizador, você poderá criar consultas de previsão usando o Construtor de Consultas de Previsão na guia Previsão do Modelo de Mineração no Designer de Mineração de Dados. Para criar uma previsão, primeiro selecione o modelo de clustering de sequências e selecione os dados de entrada. Para entradas, use uma fonte de dados externa ou crie uma consulta singleton e forneça valores em uma caixa de diálogo.

Esta lição supõe que você já saiba usar o construtor de consultas de previsão e que deseja aprender a criar consultas específicas de um modelo de clustering de sequências. Para obter informações gerais sobre como usar o Construtor de Consultas de Previsão, consulte Criando consultas de previsão DMX ou a seção Criando previsões (Tutorial de mineração de dados básico) do Tutorial de mineração de dados básico.

Criando previsões em um modelo regional

Para este cenário, primeiro você criará algumas consultas de previsão singleton, para ter uma ideia de como as previsões podem variar por região.

Para criar uma consulta de previsão singleton em um modelo de clustering de sequências

Clique na guia Previsão do Modelo de Mineração do Designer de Mineração de Dados.
No menu da coluna Modelo de Mineração, selecione Consulta Singleton.

O painel Modelo de Mineração e o painel Entrada de Consulta Singleton serão exibidos.
No painel Modelo de Mineração, clique em Selecionar Modelo (se o modo de clustering de sequências já tiver sido selecionado, você poderá ignorar esta etapa).

A caixa de diálogo Selecionar Modelo de Mineração é exibida.
Expanda o nó que representa a estrutura de mineração Clustering de Sequências com Região e selecione o modelo Clustering de Sequências com Região. Clique em OK. Por ora, ignore o painel de entrada; você especificará as entradas depois de configurar as funções de previsão.
Na grade, clique na célula vazia sob Origem e selecione Função de Previsão. Na célula sob Campo, selecione PredictSequence.

Observação

Você também pode usar a função Predict. Nesse caso, não se esqueça de escolher a versão da função Predict que utiliza uma coluna da tabela como argumento.
No painel Modelo de Mineração, selecione a tabela aninhada v Assoc Seq Line Items e arraste-a para a grade, até a caixa Critérios/Argumento para a função PredictSequence.

Arrastar e soltar nomes de tabela e de coluna permite que você crie instruções complexas sem erros de sintaxe. No entanto, isso substitui o conteúdo atual da célula, o que inclui outros argumentos opcionais para a função PredictSequence. Para exibir os outros argumentos, você pode adicionar temporariamente uma segunda instância da função à grade para referência.
Clique no botão Resultado no canto superior do Construtor de Consultas de Previsão.

Observação
Você também pode usar a função Predict. Nesse caso, não se esqueça de escolher a versão da função Predict que utiliza uma coluna da tabela como argumento.

Os resultados esperados contêm uma única coluna com o título Expressão. A coluna Expressão contém uma tabela aninhada com três colunas, como a seguir:

$SEQUENCE	Número da Linha	Modelo
1		Mountain-200

O que significam esses resultados? Lembre-se de que você não especificou entradas. Dessa forma, a previsão é feita em relação à toda a população de casos, e o Analysis Services retorna a previsão geral mais provável.

Adicionando entradas a uma consulta de previsão singleton

Até agora, você não especificou entradas. Na próxima tarefa, você usará o painel Entrada de Consulta Singleton para especificar algumas entradas para a consulta. Primeiro, use [Region] como uma entrada no modelo de clustering de sequências regional para determinar se as sequências previstas são iguais para todas as regiões. Assim, você aprenderá a modificar a consulta para adicionar a probabilidade de cada previsão e mesclar os resultados para facilitar sua exibição.

Para gerar previsões para um grupo de clientes específico

Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar à grade de criação de consultas.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor de Região e selecione Europa.
Clique no botão Resultado para exibir as previsões para clientes na Europa.
Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar à grade de criação de consultas.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor de Região e selecione América do Norte.
Clique no botão Resultado para exibir as previsões para clientes na América do Norte.

Adicionando probabilidades usando uma expressão personalizada

Gerar a probabilidade de cada previsão é ligeiramente mais complicado, já que a probabilidade é um atributo da previsão e é gerada como uma tabela aninhada. Se você já conhece DMX (Data Mining Extensions), poderá alterar com facilidade a consulta e adicionar uma instrução de subseleção na tabela aninhada. No entanto, você também poderá criar uma instrução de subseleção no Construtor de Consultas de Previsão ao adicionar uma expressão personalizada.

Para gerar probabilidades para uma sequência prevista usando uma expressão personalizada

Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar à grade de criação de consultas.
Na grade, em Origem, clique em uma nova linha e selecione Expressão Personalizada.
Deixe a caixa de texto sob Campo em branco.
Em Alias, digite t.
Na caixa Critérios/Argumento, digite a instrução de subseleção completa, como mostrado no código de amostra a seguir. Não se esqueça de incluir os parênteses inicial e final.
```
(SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))
```
Clique no botão Resultado para exibir as previsões para clientes na Europa.

Agora, os resultados contêm duas tabelas aninhadas, uma com a previsão e outra com a probabilidade da previsão. Se a consulta não funcionar, você poderá alternar para o modo de design e examinar a instrução completa da consulta, que deve ser assim:

SELECT
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]
FROM
  [Sequence Clustering with Region]
NATURAL PREDICTION JOIN
(SELECT 'Europe' AS [Region]) AS t

Trabalhando com resultados

Quando houver muitas tabelas aninhadas nos resultados, talvez seja melhor mesclá-los para obter uma exibição melhor. Para isso, modifique a consulta manualmente e adicione a palavra-chave FLATTENED.

Para mesclar conjuntos de linhas aninhadas em uma consulta de previsão

Clique no botão Consulta no canto do Construtor de Consultas de Previsão.

A grade se transformará em um painel aberto, onde você poderá exibir e modificar a instrução DMX criada pelo Construtor de Consultas de Previsão.

Após a palavra-chave SELECT, digite FLATTENED.

O texto completo da consulta deve ser similar ao seguinte:

SELECT FLATTENED
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]
FROM
  [Sequence Clustering with Region]
NATURAL PREDICTION JOIN
(SELECT 'Europe' AS [Region]) AS t

Clique no botão Resultados no canto superior do Construtor de Consultas de Previsão.

Depois de editar manualmente uma consulta, você não conseguirá voltar ao modo Design sem perder as alterações. No entanto, é possível salvar a instrução DMX criada manualmente em um arquivo de texto e então voltar para o modo Design. Quando você fizer isso, a consulta será revertida para a última versão válida do modo Design.

Criando previsões em um modelo relacionado

Os exemplos anteriores usaram uma coluna da tabela de casos, Region, como a entrada da consulta de previsão singleton, pois você estava interessado em saber se o modelo encontrou diferenças entre regiões. No entanto, depois de explorar o modelo, você decidiu que as diferenças não são significativas o suficiente para justificar recomendações de personalização de produtos por região. O que realmente interessa a você na previsão são os itens selecionados pelos clientes. Portanto, nas consultas a seguir, você usará o modelo de clustering de sequências que não inclui Region para gerar recomendações para todos os clientes.

Usando colunas da tabela aninhada como entrada

Primeiro, você criará uma consulta de previsão singleton que obtém um único item como entrada e retorna o próximo item mais provável. Para obter uma previsão desse tipo, use uma coluna de tabela aninhada como o valor de entrada. Isso acontece porque o atributo que está sendo previsto, Model, faz parte de uma tabela aninhada. O Analysis Services oferece a caixa de diálogo Entrada de Tabela Aninhada para ajudá-lo a criar com facilidade as consultas de previsão que usam atributos de tabela aninhada, por meio do Construtor de Consultas de Previsão.

Para usar uma tabela aninhada como entrada para uma previsão

Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar à grade de criação de consultas.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor de Região e selecione a linha vazia para apagar a entrada desse campo.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor de vAssocSeqLineItems e clique no botão (…).
Na caixa de diálogo Entrada de Tabela Aninhada, clique em Adicionar.
Na nova linha, clique na caixa sob Modelo e selecione Pneu de Passeio na lista. Clique em OK.
Clique no botão Resultado para exibir as previsões.

O modelo recomenda os itens a seguir para todos os clientes que escolherem Pneu de Passeio como o primeiro item. Você já sabe, pela exploração do modelo, que os clientes frequentemente compram os produtos Pneu de Passeio e Tubo de Pneu para Passeio juntos e, portanto, essas recomendações parecem boas.

$SEQUENCE	Número da Linha	Modelo
1		Tubo de Pneu para Passeio
2		Sport-100
3		Long-Sleeve Logo Jersey

Criando uma consulta de previsão em massa usando entradas de tabela aninhada

Agora que você já está satisfeito com o modelo que cria o tipo de previsões que poderão ser usadas em recomendações, crie uma consulta de previsão mapeada para uma fonte de dados externa. Essa fonte de dados fornecerá valores que representam produtos atuais. Como você está interessado na criação de uma consulta de previsão que ofereça ID do Cliente e uma lista de produtos como entrada, adicione a tabela de clientes como uma tabela de caso e a tabela de compras como a tabela aninhada. Em seguida, adicione funções de previsão, como feito anteriormente, para criar recomendações.

Esse procedimento é igual ao usado na criação de previsões para o cenário de cesta de compras da Lição 3; no entanto, em um modelo de clustering de sequências, as previsões também precisam do pedido como entrada.

Para criar uma consulta de previsão usando entradas de tabela aninhada

No painel Modelo de Mineração selecione o modelo Sequence Clustering, caso ele ainda não esteja selecionado.
Na caixa de diálogo Selecionar Tabela(s) de Entrada, clique em Selecionar Tabela de Casos.
Na caixa de diálogo Selecionar Tabela, para a Fonte de Dados, selecione Orders. Na lista Nome da Tabela/Exibição, selecione vAssocSeqOrders e clique em OK.
Na caixa de diálogo Selecionar Tabela(s) de Entrada, clique em Selecionar Tabela Aninhada.
Na caixa de diálogo Selecionar Tabela, para a Fonte de Dados, selecione Orders. Na lista Nome da Tabela/Exibição, selecione vAssocSeqLineItems e clique em OK.

O Analysis Services tentará detectar relacionamentos e os criará automaticamente se os tipos de dados forem iguais e os nomes de colunas forem semelhantes. Se os relacionamentos criados estiverem incorretos, clique com o botão direito do mouse na linha de junção e selecione Modificar Conexões para editar o mapeamento da coluna ou clique com o botão direito do mouse na linha de junção e selecione Excluir para remover completamente o relacionamento. Nesse caso, como as tabelas já foram unidas na exibição da fonte de dados, esses relacionamentos serão automaticamente adicionados ao painel de design.
Adicione uma nova linha à grade. Em Origem, selecione vAssocSeqOrders e, em Campo, selecione CustomerKey.
Adicione uma nova linha à grade. Em Origem, selecione Função de Previsão e em Campo, selecione PredictSequence.
Arraste vAssocSeqLineItems até a caixa Critérios/Argumentos. Clique no fim da caixa Critérios/Argumento e digite os argumentos a seguir: 2.

O texto completo da caixa Critérios/Argumento deve ser: [Sequence Clustering].[v Assoc Seq Line Items],2
Clique no botão Resultado para exibir as previsões para cada cliente.

Você concluiu o tutorial sobre modelos de clustering de sequências.

Próximas etapas

Você concluiu todas as seções do Tutorial de mineração de dados intermediário (Analysis Services – Mineração de dados), a próxima etapa será aprender a usar instruções DMX (Data Mining Extensions) para criar modelos e gerar previsões. Para obter mais informações, consulte Criando e consultando modelos de mineração de dados com DMX: Tutoriais (Analysis Services – Mineração de dados).

Se você já conhece conceitos de programação, também poderá usar Objetos de Gerenciamento de Análise (AMO) para começar a trabalhar com objetos de mineração de dados programaticamente. Para obter mais informações, consulte Classes de mineração de dados AMO.

Consulte também

Referência

Conteúdo do modelo de mineração para modelos de clustering de sequências (Analysis Services – Mineração de Dados)

Conceitos

Consultando um modelo de clusterização de sequência (Analysis Services – Mineração de Dados)

Compartilhar via