Compreendendo tendências no modelo de série temporal (Tutorial de mineração de dados intermediário)
Quando você examina os diversos modelos criados com base em dados agregados, vê que as linhas de tendência e de previsão parecem ser bem diferentes, dependendo se você somou valores e quantidades nos diferentes modelos e regiões ou se fez uma média dos números.
Antes de decidir que modelo aplicar como o modelo geral para fazer projeções mundiais, você revisará os dados subjacentes com o gráfico de previsão para entender melhor as previsões.
Você observou que as linhas de tendência se sobrepuseram até junho de 2002, quando as linhas de quantidade e de valor divergem. Em seguida, em julho de 2004, as linhas divergiram novamente.
Nesta tarefa, você criará um cálculo nomeado baseado na exibição da fonte de dados original para ajudá-lo a controlar a relação entre quantidade e preços. Depois criará um gráfico dinâmico com essa taxa para ajudá-lo a compreender as divisões nas linhas de tendência.
Revisando os dados subjacentes
Para criar um cálculo nomeado
No Gerenciador de Soluções, expanda Exibições da Fonte de Dados e clique duas vezes em SalesByRegion.dsv.
Clique com o botão direito do mouse na tabela vTimeSeries e selecione Novo Cálculo Nomeado.
Na caixa Criar Cálculo Nomeado, para Nome, digite UnitAmt.
Na caixa de texto Expressão, digite Valor/Quantidade. Clique em OK.
Agora, a tabela vTimeSeries contém uma coluna calculada adicional, UnitAmt. Essa coluna calculada só é armazenada na definição da exibição da fonte de dados para o projeto de mineração de dados e não afeta a exibição do banco de dados relacional subjacente.
Para criar um gráfico dinâmico usando o cálculo nomeado.
Clique com o botão direito do mouse na tabela vTimeSeries e selecione Explorar Dados.
Na guia Explorar Tabela vTimeSeries, clique na guia Tabela Dinâmica.
Arraste o campo TimeIndex da caixa Lista de Campos da Tabela Dinâmica e solte-o na superfície de design da tabela dinâmica onde está escrito Solte Campos de Coluna Aqui.
Arraste o campo ModelRegion da caixa Lista de Campos da Tabela Dinâmica e solte-o na superfície de design da tabela dinâmica onde está escrito Solte Campos de Linha Aqui.
Arraste o campo UnitAmt da caixa Lista de Campos da Tabela Dinâmica e solte-o na superfície de design da tabela dinâmica onde está escrito Soltar Campos de Totais ou Detalhes Aqui.
Revisando os modelos agregados
Na tabela dinâmica, você pode perceber que, em diversos momentos, houve alterações substanciais no valor de vendas por unidade, possivelmente por causa de alterações nos preços do produto. Em julho de 2003, há outra alteração significativa, quando uma nova versão, a T1000, foi adicionada a todas as regiões. Todas essas alterações afetam as tendências calculadas no modelo. Um modelo generalizado é útil porque minimiza o impacto de qualquer alteração. No entanto, em alguns cenários, é possível que você decida criar modelos separados para novos armazenamentos, para que os dados contidos ali não afetem as tendências.
Para este tutorial, você escolherá um dos modelos agregados para aplicá-lo a projeções de vendas. Lembre-se de que você criou quatro modelos de mineração diferentes, baseados em uma medida de agregação diferente. Você usará as ferramentas oferecidas pelo visualizador de série temporal, além da tabela dinâmica criada anteriormente, para guiar esta decisão. O diagrama a seguir mostra o gráfico de série temporal criado para os modelos agregados. As duas linhas de série em cinza mostram médias e as duas linhas de série em verde mostram somas.
Antes de decidir que modelo de mineração usar para projeções de vendas, você decide investigar os seguintes pontos:
Modelos de mineração baseados em tendência ascendente de Valor enquanto que os modelos baseados em Quantidade têm um declínio cíclico.
As projeções baseadas em valor médio (AvgAmt) e as projeções baseadas em quantidade de soma (SumQty) estão muito distantes.
Embora linhas de tendência em três dos modelos se nivelem após 5 previsões, a linha de tendência do modelo baseado em quantidade de soma continua a subir vertiginosamente.
Verifique três aspectos antes de obter mais informações. Primeiro, marque a caixa de seleção Exibir Desvios para mostrar os desvios padrão para cada previsão. Uma barra de erro maior indica que há uma variação maior no valor previsto.
Segundo, observe que a unidade do eixo y é porcentagem; além disso, note que a escala do gráfico muda, dependendo dos dados desse gráfico. Por padrão, o Visualizador MTS ajusta automaticamente as unidades no eixo de porcentagem para facilitar a exibição do gráfico. Dessa forma, se você quiser usar uma escala específica ou fixa, utilize uma consulta de previsão para criar e exportar os valores e crie um gráfico em outro aplicativo, como o Microsoft Excel.
Por fim, você poderá usar o visualizador de árvore de decisão do modelo de série temporal para compreender as divisões do modelo. Em um modelo de série temporal, uma divisão, ou uma ramificação da árvore de decisão, pode significar que o declive da linha de tendência mudou significativamente em algum momento ou pode significar que a árvore se ramificou com base alguma outra condição. A exibição que mostra essas divisões como nós em uma exibição de árvore permite que você faça um detalhamento do que causou a divisão.
Para exibir a árvore de decisão para cada série
No Gerenciador de Soluções, expanda Exibições da Fonte de Dados e clique com o botão direito do mouse em AllRegions.dsv.
Clique com o botão direito do mouse na tabela vTimeSeries e selecione Explorar Dados.
Na guia Explorar Tabela vTimeSeries, clique na guia Tabela Dinâmica.
Arraste o campo ReportingDate da caixa Lista de Campos da Tabela Dinâmica e solte-o na superfície de design da tabela dinâmica onde está escrito Solte Campos de Coluna Aqui.
Arraste o campo Região da caixa Lista de Campos da Tabela Dinâmica e solte-o na superfície de design da tabela dinâmica onde está escrito Solte Campos de Linha Aqui.
Arraste o campo UnitAmt da caixa Lista de Campos da Tabela Dinâmica e solte-o na superfície de design da tabela dinâmica onde está escrito Soltar Campos de Totais ou Detalhes Aqui.
Também é importante compreender que, uma vez que um modelo de série temporal é calculado com médias móveis, os valores de dados do final da série de dados podem ter um impacto maior na previsão do que os valores de dados do início da série de dados. Além disso, a dica de periodicidade fornecida por você durante a criação do modelo também afeta a forma como as médias são usadas com o passar do tempo.
Conclusão
Com base nesta análise, você aprendeu:
A quantidade é inerentemente volátil porque os valores absolutos podem ser muito baixos para alguns armazenamentos; além disso, a exibição do gráfico tende a exagerar as diferenças apresentando os números como porcentagens.
O valor parece ser ainda mais volátil, já que Valor dependente de Quantidade mas também é afetado pelas alterações de preços.
A forte tendência ascendente em previsões da série M200 América do Norte é causada pelo fato de que o volume de vendas foi especialmente alto para a combinação de produto e região no final dos dados históricos.
Como resultado da exploração detalhada dos dados e dos vários modelos, você está satisfeito porque encontrou um modelo confiável. Se a sua empresa exigir justificativa para a análise, você poderá obter fórmulas e dados de suporte usando as estatísticas disponíveis no InfoTips ou pesquisando ou consultando o conteúdo do modelo.
Na próxima lição, você usará o modelo baseado em quantidade média para fazer previsões para quantidade em todas as regiões.
Próxima tarefa na lição
Prevendo com o modelo de previsão médio (Tutorial de mineração de dados intermediário)