Partilhar via


Previsões de série temporal avançadas (Tutorial de mineração de dados intermediário)

Você viu na exploração do modelo de previsão que embora as vendas na maioria das regiões siga um padrão similar, algumas regiões e alguns modelos, como o M200 na região do Pacífico, exibem tendências muito diferentes. Isso não é surpresa para você, já que sabe que as diferenças entre as regiões são comuns e podem ser causadas por muitos fatores, incluindo promoções de marketing, geração de relatórios imprecisos ou eventos geopolíticos.

Porém, seus usuários estão pedindo um modelo que possa ser aplicado no mundo todo. Portanto, para minimizar o efeito dos fatores individuais sobre as projeções, você decide criar um modelo baseado em medidas agregadas de vendas mundiais. Assim, você poderá fazer previsões com esse modelo para cada região.

Nesta tarefa, você criará todas as fontes de dados de que precisa para executar as tarefas de previsão avançadas. Você criará duas exibições de fonte de dados para usar como entradas para a consulta de previsão, e uma exibição de fonte de dados para usar na criação de um novo modelo.

Etapas

  1. Preparar os dados de vendas estendidos (para previsão)

  2. Preparar os dados agregados (para criar o modelo)

  3. Preparar a série de dados (para previsão cruzada)

  4. Fazer a previsão usando EXTEND

  5. Criar o modelo de previsão cruzada

  6. Fazer a previsão usando REPLACE

  7. Revisar as novas previsões

Criando os novos dados de vendas estendidos

Para atualizar seus dados de vendas, você precisará obter os números de vendas mais recentes. De interesse em particular são os dados da região do Pacífico, que iniciou uma promoção de vendas regional para chamar a atenção para as novas lojas e aumentar o reconhecimento de seus produtos.

Para este cenário, vamos supor que os dados foram importados de uma pasta de trabalho do Excel que contém apenas três meses de novos dados para duas regiões. Você criará uma tabela para obter os dados que usam um script Transact-SQL e depois definirá uma exibição de fonte de dados para usar na previsão.

Criar a tabela com os novos dados de vendas

  1. Em uma janela de consulta do Transact-SQL, execute a instrução a seguir para adicionar os dados de vendas ao banco de dados AdventureWorksDW (ou qualquer outro banco de dados).

    USE [database name];
    GO
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL 
        DROP TABLE [dbo].[NewSalesData];
    GO
    CREATE TABLE [dbo].[NewSalesData](
    [Series] [nvarchar](255) NULL,
    [NewDate] [datetime] NULL,
    [NewQty] [float] NULL,
    [NewAmount] [money] NULL
    ) ON [PRIMARY]
    
    GO
    
  2. Insira os novos valores usando o script a seguir.

    INSERT INTO [NewSalesData]
    (Series,NewDate,NewQty,NewAmount)
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),
    ('M200 North America', '7/25/08', 94, '$216,916.00'),
    ('M200 North America', '8/25/08', 94, '$216,891.00'),
    ('M200 North America', '9/25/08', 91,'$209,943.00');
    
    Observação sobre cuidadosCuidado

    Os aspas são usadas com os valores de moeda para evitar problemas com o separador de vírgula e o símbolo de moeda. Você também pode transmitir os valores de moeda neste formato: 130170.22

    Observe que as datas usadas no banco de dados de exemplo foram alteradas para esta versão. Se você estiver usando uma edição anterior do AdventureWorks, poderá precisar ajustar as datas inseridas de acordo.

Criar uma exibição de fonte de dados usando os novos dados de vendas

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Exibições de Fonte de Dados e, em seguida, selecione Nova Exibição da Fonte de Dados.

  2. No Assistente de Exibição da Fonte de Dados, faça as seguintes seleções:

    Fonte de Dados: Adventure Works DW Multidimensional 2012

    Selecionar Tabelas e Exibições: selecione a tabela que acabou de criar, NewSalesData.

  3. Clique em Concluir.

  4. Na superfície de design da Exibição da Fonte de Dados, clique com o botão direito do mouse em NewSalesData e selecione Explorar Dados para verificar os dados.

Observação sobre cuidadosCuidado

Você usará estes dados somente para previsão. Portanto, não importa se os dados estão incompletos.

Criando os dados para o modelo de previsão cruzada

Os dados que foram usados no modelo de previsão original já foram agrupados de certa forma pela exibição vTimeSeries, que dividiu vários modelos de bicicleta em um número menor de categorias e mesclou os resultados de países individuais em regiões. Para criar um modelo que possa ser usado para projeções mundiais, você criará mais algumas agregações simples diretamente no Designer de Exibição da Fonte de Dados. A nova exibição da fonte de dados contém apenas a soma e a média das vendas de todos os produtos para todas as regiões.

Depois de criar a fonte de dados usada no modelo, você deve criar uma nova exibição da fonte de dados para usar na previsão. Por exemplo, se você desejar prever vendas para a Europa usando o novo modelo mundial, deverá preencher os dados somente para a região da Europa. Dessa forma, você definirá uma nova exibição de fonte de dados que filtra os dados originais, e alterará a condição de filtro para cada conjunto de consultas de previsão.

Para criar os dados do modelo usando uma exibição de fonte de dados personalizada

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Exibições de Fonte de Dados e, em seguida, selecione Nova Exibição da Fonte de Dados.

  2. Na página de boas-vindas do assistente, clique em Avançar.

  3. Na página Selecionar Fonte de Dados, selecione Adventure Works DW Multidimensional 2012 e, em seguida, clique em Avançar.

  4. Na página Selecionar Tabelas e Exibições, não adicione tabelas, apenas clique em Avançar.

  5. Na página Concluindo o Assistente, digite o nome AllRegions e, em seguida, clique em Concluir.

  6. Em seguida, clique com o botão direito do mouse na superfície de design da exibição da fonte de dados em branco e, em seguida, selecione Nova Consulta Nomeada.

  7. Na caixa de diálogo Criar Consulta Nomeada, em Nome, digite AllRegions e em Descrição, digite Soma e média de vendas para todos os modelos e regiões.

  8. No painel de texto do SQL, digite a seguinte instrução e clique em OK:

    SELECT ReportingDate, 
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,
    'All Regions' as [Region]
    FROM dbo.vTimeSeries 
    GROUP BY ReportingDate
    
  9. Clique com o botão direito do mouse na tabela AllRegions e, em seguida, selecione Explorar Dados.

Para criar a série de dados para previsão cruzada

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Exibições de Fonte de Dados e, em seguida, selecione Nova Exibição da Fonte de Dados.

  2. No Assistente de Exibição da Fonte de Dados, faça as seguintes seleções:

    Fonte de Dados: Adventure Works DW Multidimensional 2012

    Selecionar Tabelas e Exibições: não selecione nenhuma tabela.

    Nome: T1000 Pacific Region

  3. Clique em Concluir.

  4. Clique com o botão direito do mouse na superfície de design vazia de T1000 Pacific Region.dsv e, em seguida, selecione Nova Consulta Nomeada.

    A caixa de diálogo Criar Consulta Nomeada é aberta. Digite o nome novamente e, em seguida, adicione a seguinte descrição:

    Nome: T1000 Pacific Region

    Descrição: filtrar vTimeSeries por região e modelo

  5. No painel de texto, digite a seguinte consulta e clique em OK:

    SELECT ReportingDate, ModelRegion, Quantity, Amount
    FROM dbo.vTimeSeries
    WHERE (ModelRegion = N'T1000 Pacific')
    
    ObservaçãoObservação

    Como você precisará criar previsões para cada série separadamente, talvez você queira copiar o texto da consulta e salvá-lo em um arquivo de texto para que seja possível reutilizá-lo na outra série de dados.

  6. Na superfície de design da Exibição da Fonte de Dados, clique com o botão direito do mouse em T1000 Pacific e selecione Explorar Dados para verificar se os dados foram filtrados corretamente.

    Você usará esses dados como a entrada para o modelo ao criar consultas da previsão cruzada.

Próxima tarefa na lição

Previsões de série temporal usando dados atualizados (Tutorial de mineração de dados intermediário)

Consulte também

Referência

Referência técnica do algoritmo MTS

Conceitos

Algoritmo MTS

Exibições de fontes de dados em modelos multidimensionais