Criando previsões (Tutorial de mineração de dados básico)
Depois de testar a precisão de seus modelos de mineração e decidir que está satisfeito com os resultados, você pode gerar previsões usando o Construtor de Consultas de Previsão na guia Previsão do Modelo de Mineração na Designer de Mineração de Dados.
O Construtor de Consultas de Previsão contém três exibições. Com os modos de exibição Design e Consulta, você pode criar e examinar sua consulta. Em seguida, você pode executar a consulta e exibir os resultados na exibição Resultado .
Todas as consultas de previsão usam DMX, que é a abreviação da linguagem Data Mining Extensions. O DMX tem sintaxe semelhante à de T-SQL mas é usado para consultas em objetos de mineração de dados. Embora a sintaxe DMX não seja complicada, usar um construtor de consultas como este ou aquele no SQL Server Data Mining Add-Ins para Office, facilita muito a seleção de entradas e expressões de build, portanto, é altamente recomendável que você aprenda as noções básicas.
Criando a consulta
A primeira etapa na criação de uma consulta de previsão é selecionar um modelo de mineração e tabela de entrada.
Para selecionar um modelo e uma tabela de entrada
Na guia Previsão do Modelo de Mineração do Designer de Mineração de Dados, na caixa Modelo de Mineração, clique em Selecionar Modelo.
Na caixa de diálogo Selecionar Modelo de Mineração , navegue pela árvore até a estrutura Endereçamento Direcionado, expanda a estrutura, selecione
TM_Decision_Tree
e clique em OK.Na caixa Selecionar Tabelas de Entrada , clique em Selecionar Tabela de Maiúsculas e Minúsculas.
Na caixa de diálogo Selecionar Tabela , na lista Fonte de Dados , selecione a exibição de fonte de dados Adventure Works DW Multidimensional 2012.
Em Nome da Tabela/Exibição, selecione a tabela ProspectiveBuyer (dbo) e clique em OK.
A
ProspectiveBuyer
tabela se assemelha mais à tabela de maiúsculas e minúsculas vTargetMail .
Mapeando as colunas
Depois de selecionar a tabela de entrada, o Construtor de Consultas de Previsão cria um mapeamento padrão entre o modelo de mineração e a tabela de entrada, com base nos nomes das colunas. Pelo menos uma coluna da estrutura deve corresponder a uma coluna nos dados externos.
Importante
Os dados que você usa para determinar a precisão dos modelos devem conter uma coluna que possa ser mapeada para a coluna previsível. Se essa coluna não existir, você poderá criar uma com valores vazios, mas ela precisa ter o mesmo tipo de dados que a coluna previsível.
Para mapear as entradas para o modelo
Clique com o botão direito do mouse nas linhas que conectam a janela Modelo de Mineração à janela Selecionar Tabela de Entrada e selecione Modificar Conexões.
Observe que nem todas as colunas são mapeadas. Adicionaremos mapeamentos para várias Colunas de Tabela. Também geraremos uma nova coluna de data de aniversário com base na coluna de data atual, visando melhorar a correspondência das colunas.
Em Coluna da Tabela, clique na
Bike Buyer
célula e selecione ProspectiveBuyer.Unknown na lista suspensa.Isso mapeia a coluna previsível, [Comprador de Bicicleta], para uma coluna da tabela de entrada.
Clique em OK.
Em Gerenciador de Soluções, clique com o botão direito do mouse na exibição da fonte de dados endereçamento direcionado e selecione Exibir Designer.
Clique com o botão direito do mouse na tabela, ProspectiveBuyer, e selecione Novo Cálculo Nomeado.
Na caixa de diálogo Criar Cálculo Nomeado , em Nome da coluna, digite
calcAge
.Para Descrição, digite Calcular idade com base na data de nascimento.
Na caixa Expressão , digite
DATEDIFF(YYYY,[BirthDate],getdate())
e clique em OK.Como a tabela de entrada não tem nenhuma coluna Age correspondente à do modelo, você pode usar essa expressão para calcular a idade do cliente da coluna BirthDate na tabela de entrada. Como a Age foi identificada como a coluna mais influente para prever a compra de bicicletas, ela deve existir no modelo e na tabela de entrada.
Em Data Mining Designer, selecione a guia Previsão do Modelo de Mineração e abra novamente a janela Modificar Conexões.
Em Coluna da Tabela, clique na célula Idade e selecione ProspectiveBuyer.calcAge na lista suspensa.
Aviso
Se você não encontrar a coluna na lista, poderá ter que atualizar a definição da exibição da fonte de dados que é carregada no designer. Para fazer isso, no menu Arquivo , selecione Salvar tudo e feche e abra novamente o projeto no designer.
Clique em OK.
Criando a consulta de previsão
O primeiro botão na barra de ferramentas da guia Previsão do Modelo de Mineração é o botão Alternar para o modo de exibição de design/Alternar para o modo de exibição de resultados/Alternar para o modo de exibição de consulta . Clique na seta para baixo neste botão e selecione Design.
Na grade da guia Previsão do Modelo de Mineração , clique na célula na primeira linha vazia na coluna Origem e selecione Função de Previsão.
Na linha Função de Previsão , na coluna Campo , selecione
PredictProbability
.Na coluna Alias da mesma linha, digite Probabilidade de resultado.
Na janela Modelo de Mineração acima, selecione e arraste [Comprador de Bicicleta] para a célula Critérios/Argumento .
Quando você solta, [TM_Decision_Tree]. [Comprador de Bicicleta] aparece na célula Critérios/Argumento .
Isso especifica a coluna de destino da função
PredictProbability
. Para obter mais informações sobre funções, consulte Referência de função DMX (Extensões de Mineração de Dados).Clique na próxima linha vazia na coluna Origem e selecione TM_Decision_Tree modelo de mineração.
TM_Decision_Tree
Na linha, na coluna Campo, selecioneBike Buyer
.TM_Decision_Tree
Na linha , na coluna Critérios/Argumento , digite=1
.Clique na próxima linha vazia na coluna Origem e selecione a tabela ProspectiveBuyer.
ProspectiveBuyer
Na linha, na coluna Campo, selecione ProspectiveBuyerKey.Essa ação adicionará o identificador exclusivo à consulta de previsão para que você possa identificar a probabilidade de alguém comprar ou não uma bicicleta.
Adicione mais cinco linhas à grade. Para cada linha, selecione a tabela ProspectiveBuyer como a Origem e adicione as seguintes colunas nas células Field :
calcAge
LastName
Nome
AddressLine1
AddressLine2
Por fim, execute a consulta e navegue pelos resultados.
O Construtor de Consultas de Previsão também inclui estes controles:
Mostrar caixa de marcar
Permite remover as cláusulas de consulta sem precisar excluí-las do designer. Essa opção pode ser útil quando você está trabalhando com consultas complexas e deseja preservar a sintaxe sem precisar copiar e colar a linguagem DMX na janela.
Grupo
insere um parênteses de abertura (à esquerda) no início da linha selecionada, ou insere um parêntese de fechamento (à direita) no final da linha atual.
AND/OR
Insere o
AND
operador ou oOR
operador imediatamente após a função ou coluna atual.
Para executar a consulta e exibir resultados
Na guia Previsão do Modelo de Mineração , selecione o botão Resultado .
Depois que a consulta for executada e os resultados exibidos, você poderá revisá-los.
A guia Previsão do Modelo de Mineração exibe informações de contato para clientes potenciais que provavelmente serão compradores de bicicletas. A coluna Probabilidade do resultado indica a probabilidade de a previsão estar correta. Você poderá usar esses resultados para determinar para quais clientes em potencial a mala direta deverá ser direcionada.
Neste momento, você pode salvar os resultados. Você tem três opções:
Clique com o botão direito do mouse em uma linha de dados nos resultados e selecione Copiar para salvar apenas esse valor (e o título da coluna) na Área de Transferência.
Clique com o botão direito do mouse em qualquer linha nos resultados e selecione Copiar Tudo para copiar todo o conjunto de resultados, incluindo títulos de coluna, para a Área de Transferência.
Clique em Salvar resultado da consulta para salvar os resultados diretamente em um banco de dados da seguinte maneira:
Na caixa de diálogo Salvar Resultado da Consulta de Mineração de Dados , selecione uma fonte de dados ou defina uma nova fonte de dados.
Digite um nome para a tabela que conterá os resultados da consulta.
Use a opção Adicionar ao DSV para criar a tabela e adicioná-la a uma exibição de fonte de dados existente. Isso será útil se você quiser manter todas as tabelas relacionadas para um modelo, como dados de treinamento, dados de origem de previsão e resultados de consulta, na mesma exibição da fonte de dados.
Use a opção Substituir, se existir, para atualizar uma tabela existente com os resultados mais recentes.
Use a opção para substituir a tabela se você adicionou alguma coluna à consulta de previsão, alterou os nomes ou tipos de dados de alguma coluna na consulta de previsão, ou se executou alguma instrução ALTER na tabela de destino.
Além disso, se várias colunas tiverem o mesmo nome (por exemplo, a expressão de nome de coluna padrão), você deverá criar um alias para as colunas com nomes duplicados ou um erro será gerado quando o designer tentar salvar os resultados em SQL Server. A razão é que o SQL Server não permite que várias colunas tenham o mesmo nome.
Para obter mais informações, consulte Caixa de diálogo Salvar Resultado da Consulta de Mineração de Dados (Exibição de Previsão do Modelo de Mineração).
Próxima tarefa da lição
Usando o detalhamento em dados de estrutura (Tutorial de mineração de dados básico)
Consulte Também
Criar uma consulta de previsão usando o construtor de consultas de previsão