Personalizando e processando o modelo de previsão (Tutorial de mineração de dados intermediário)
O algoritmo MTS da Microsoft oferece vários parâmetros que afetam o modo como um modelo é criado e como os dados de tempo são analisados. Alterar essas propriedades pode afetar significativamente a forma como o modelo de mineração faz previsões.
Para esta tarefa do tutorial, você executará as seguintes tarefas para modificar o modelo:
Você personalizará a forma como seu modelo trata os períodos de tempo adicionando um novo valor ao PERIODICITY_HINT parâmetro.
Você aprenderá dois outros parâmetros importantes para o algoritmo MTS: FORECAST_METHOD, que permite controlar o método usado na previsão, e PREDICTION_SMOOTHING, que permite personalizar a combinação de previsões de longo prazo e de curto prazo.
Opcionalmente, você dirá ao algoritmo como deseja inserir os valores ausentes.
Depois de fazer todas as alterações, você implantará e processará o modelo.
Definindo os parâmetros de série temporal
Dicas de periodicidade
O parâmetro PERIODICITY_HINT fornece ao algoritmo informações sobre períodos de tempo adicionais que você espera ver nos dados. Por padrão, os modelos de série temporal tentarão detectar automaticamente um padrão nos dados. Porém, se você já souber o ciclo de tempo esperado, fornecer uma dica de periodicidade poderá melhorar a exatidão do modelo. No entanto, se você fornecer a dica de periodicidade errada, poderá diminuir exatidão; portanto, se você não souber ao certo que valor deve ser usado, é melhor usar o padrão.
Por exemplo, a exibição usada neste modelo agrega dados de vendas de Adventure Works DW Multidimensional 2012 mensalmente. Portanto, cada intervalo de tempo usado pelo modelo representa um mês, e todas as previsões também estarão em meses. Como há 12 meses no ano e você espera que padrões de vendas repitam mais ou menos anualmente, você definirá o parâmetro PERIODICITY_HINT como 12, para indicar que 12 intervalos de tempo (meses) constituem um ciclo de vendas completo.
Método de previsão
O parâmetro FORECAST_METHOD controla se o algoritmo de série temporal está otimizado para previsões a curto ou a longo prazo. Por padrão, o parâmetro FORECAST_METHOD é definido como MIXED, o que significa que dois algoritmos diferentes são combinados e equilibrados para oferecer bons resultados em previsões de curto e de longo prazos.
Entretanto, se você quiser usar um algoritmo específico, poderá altera o valor para ARIMA ou ARTXP.
Ponderando previsões de longo prazo contra previsões de curto prazo
Você também pode personalizar a forma como as previsões de longo prazo e de curto prazo são combinadas usando o parâmetro PREDICTION_SMOOTHING. Por padrão, esse parâmetro é definido como 0,5, o que geralmente oferece o melhor equilíbrio para a precisão geral.
Para alterar parâmetros do algoritmo
Na guia Modelos de Mineração, clique com o botão direito do mouse em Previsão e selecione Definir Parâmetros do Algoritmo.
Na linha PERIODICITY_HINT da caixa de diálogo Parâmetros de Algoritmo, clique na coluna Valor e digite {12}, incluindo as chaves.
Por padrão, o algoritmo também adicionará o valor {1}.
Na linha FORECAST_METHOD, verifique se a caixa de texto Valor está em branco ou se foi definida como MIXED. Caso tenha sido inserido um valor diferente, digite MIXED para retornar o parâmetro ao valor padrão.
Na linha PREDICTION_SMOOTHING, verifique se a caixa de texto Valor está em branco ou se foi definida como 0,5. Caso tenha sido inserido um valor diferente, clique em Valor e digite 0,5 para retornar o parâmetro ao valor padrão.
Observação O parâmetro PREDICTION_SMOOTHING só está disponível no SQL Server Enterprise. Dessa forma, não é possível exibir ou alterar o valor do parâmetro PREDICTION_SMOOTHING no SQL Server Standard. Porém, o comportamento padrão é usar os dois algoritmos e atribuir o mesmo valor a ambos.
Clique em OK.
Manipulando dados ausentes (opcional)
Na maioria dos casos, seus dados de venda poderão ter lacunas preenchidas por nulos, ou uma loja pode não ter conseguido cumprir o prazo da emissão de relatórios, deixando uma célula vazia no final da série. Nesses cenários, o Analysis Services gera o erro a seguir e não processa o modelo.
"Erro (Mineração de dados): Carimbos de horas não sincronizados, começando com a série <nome da série> do modelo de mineração <nome do modelo>. Todas as séries temporais devem terminar na mesma marca de tempo e não podem ter pontos de dados ausentes arbitrariamente. A definição do parâmetro MISSING_VALUE_SUBSTITUTION como Previous ou como uma constante numérica corrigirá automaticamente pontos de dados ausentes, onde possível."
Para impedir esse erro, você pode especificar que o Analysis Services forneça automaticamente novos valores para preencher as lacunas usando qualquer um dos métodos a seguir:
Usando um valor médio. Essa média é calculada usando todos os valores válidos da mesma série de dados.
Usando o valor anterior. Você pode substituir valores anteriores por várias células ausentes, mas não pode preencher os valores iniciais.
Usando um valor constante fornecido por você.
Para especificar que as lacunas sejam preenchidas por valores médios
Na guia Modelos de Mineração, clique com o botão direito do mouse na coluna Previsão e selecione Definir Parâmetros do Algoritmo.
Na caixa de diálogo Parâmetros de Algoritmo, na linha MISSING_VALUE_SUBSTITUTION, clique na coluna Valor e digite Médio.
Criar o modelo
Para usar o modelo, você deve implantá-lo em um servidor e processar o modelo executando os dados de treinamento pelo algoritmo.
Para processar o modelo de previsão
No menu Modelo de Mineração do SQL Server Data Tools, selecione Estrutura de Mineração do Processo e Todos os Modelos.
No aviso que pergunta se você deseja construir e implantar o projeto, clique em Sim.
Na caixa de diálogo Processar Estrutura de Mineração - Previsão, clique em Executar.
A caixa de diálogo Andamento do Processo é aberta para exibir informações sobre o processamento do modelo. O processamento do modelo pode demorar algum tempo.
Depois que o processamento estiver completo, clique em Fechar para sair da caixa de diálogo Progresso do Processo.
Clique em Fechar novamente para sair da caixa de diálogo Processar Estrutura de Mineração.
Próxima tarefa na lição
Explorando o modelo de previsão (tutorial de mineração de dados intermediário)
Consulte também
Referência
Referência técnica do algoritmo MTS
Conceitos
Requisitos e considerações de processamento (mineração de dados)