進階時間序列預測 (中繼資料採礦教學課程)
您已經從預測模型的瀏覽得知,雖然大部分地區的銷售都遵循類似的模式,但是某些地區和某些模型 (如太平洋地區的 M200 模型) 則呈現了非常不同的趨勢。 這不令您吃驚,因為您知道地區之間的差異是很常見的,而且可能是因為許多因素所造成,其中包括促銷活動、不正確的報表或地理政治事件。
但是您的使用者要求全球適用的模型。 因此,為了讓個別因素對預測的影響降至最低,您決定建立一個根據全球銷售彙總量值的模型。 然後您可以使用這個模型,針對各地區做預測。
在這項工作中,您將建立執行進階預測工作所需的所有資料來源。 您將建立兩個做為預測查詢輸入的資料來源檢視和一個用於建立新模型的資料來源檢視。
步驟
建立新的擴充銷售資料
您需要取得最新的銷售數字,以更新銷售資料。 特別值得注意的是來自太平洋地區的最新資料,這裡剛發起區域性銷售促銷,讓新店面及其商品吸引眾人目光。
在此案例中,我們將假設資料已從 Excel 活頁簿匯入,其中包含數個區域的三個月新資料。 您將使用 Transact-SQL 腳本建立資料的資料表,然後定義用於預測的資料來源檢視。
使用新銷售資料建立資料表
在 Transact-SQL 查詢視窗中,執行下列陳述式,將銷售資料加入至 AdventureWorksDW 資料庫 (或其他任何資料庫)。
USE [database name]; GO IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL DROP TABLE [dbo].[NewSalesData]; GO CREATE TABLE [dbo].[NewSalesData]([Series] [nvarchar](255) NULL, [NewDate] [datetime] NULL, [NewQty] [float] NULL, [NewAmount] [money] NULL) ON [PRIMARY] GO
使用下列指令碼插入新值。
INSERT INTO [NewSalesData] (Series,NewDate,NewQty,NewAmount) VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'), ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '), ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '), ('T1000 Europe', '7/25/08', 37, '$88,210.00 '), ('T1000 Europe', '8/25/08', 41, '$97,746.00 '), ('T1000 Europe', '9/25/08', 37, '$88,210.00 '), ('T1000 North America', '7/25/08', 69, '$164,500.00 '), ('T1000 North America', '8/25/08', 66, '$157,348.00 '), ('T1000 North America', '9/25/08', 58, '$138,276.00 '), ('M200 Pacific', '7/25/08', 65, '$149,824.35'), ('M200 Pacific', '8/25/08', 54, '$124,619.46'), ('M200 Pacific', '9/25/08', 61, '$141,143.39'), ('M200 Europe', '7/25/08', 75, '$173,026.00'), ('M200 Europe', '8/25/08', 76, '$175,212.00'), ('M200 Europe', '9/25/08', 84, '$193,731.00'), ('M200 North America', '7/25/08', 94, '$216,916.00'), ('M200 North America', '8/25/08', 94, '$216,891.00'), ('M200 North America', '9/25/08', 91,'$209,943.00');
警告
引號用於貨幣值,以避免通用分隔符號和貨幣符號發生問題。 您也可以使用下列格式傳入貨幣值:
130170.22
請注意,範例資料庫中使用的日期已在此版本中變更。 如果您使用的是舊版的 AdventureWorks,可能需要針對插入的日期進行相應的調整。
使用新銷售資料建立資料來源檢視
在[方案總管] 中,以滑鼠右鍵按一下[資料來源檢視],然後選取 [新增資料來源檢視]。
在資料來源檢視精靈中,進行下列選擇:
資料來源:Adventure Works DW 多維度 2012
選取 [資料表和檢視]:選取您剛才建立的資料表 NewSalesData。
按一下 [完成] 。
在 [資料來源檢視] 設計介面中,以滑鼠右鍵按一下 [NewSalesData],然後選取 [ 探索資料 ] 以確認資料。
警告
此資料僅供預測,資料不完整沒有關係。
為交叉預測模型建立資料
原始預測模型中所用的資料已經依 vTimeSeries 檢視稍微分組,數款自行車已摺疊為較少的類別目錄數目,各國結果已合併為地區。 若要建立可用於全球預測的模型,您將直接在資料來源檢視設計工具中建立一些其他簡單彙總。 新的資料來源檢視只包含所有地區所有產品的銷售總和與平均值。
在建立用於模型的資料來源之後,您必須建立一個用於預測的新資料來源檢視。 例如,如果您要使用新的全球模型來預測歐洲銷售,必須只饋送歐洲地區的資料。 因此,您將設定可篩選原始資料的新資料來源檢視,並針對各組預測查詢來變更篩選條件。
若要使用自訂資料來源檢視建立模型資料
在[方案總管] 中,以滑鼠右鍵按一下[資料來源檢視],然後選取 [新增資料來源檢視]。
在精靈的歡迎頁面中,按 [下一步]。
在 [ 選取資料來源] 頁面上,選取 [Adventure Works DW 多維度 2012],然後按 [ 下一步]。
在頁面的 [選取資料表和檢視表] 中,請勿新增任何資料表,只要按 [ 下一步] 即可。
在頁面上, [完成精靈] 輸入名稱
AllRegions
,然後按一下 [ 完成]。接下來,以滑鼠右鍵按一下空白資料來源檢視設計介面,然後選取 [新增具名查詢]。
在 [ 建立具名查詢 ] 對話方塊中,針對 [ 名稱]、[類型
AllRegions
] 和 [ 描述],輸入 所有模型和區域的 [總和] 和 [平均銷售額]。在 SQL 文字窗格中,輸入下列陳述式,然後按一下 [確定]:
SELECT ReportingDate, SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty, SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt, 'All Regions' as [Region] FROM dbo.vTimeSeries GROUP BY ReportingDate
以滑鼠右鍵按一下
AllRegions
資料表,然後選取 [ 探索資料]。
若要建立用於交叉預測的數列資料
在[方案總管] 中,以滑鼠右鍵按一下[資料來源檢視],然後選取 [新增資料來源檢視]。
在資料來源檢視精靈中,進行下列選擇:
資料來源:Adventure Works DW 多維度 2012
選取資料表和檢視表:不選取任何資料表
名稱:
T1000 Pacific Region
按一下 [完成] 。
以滑鼠右鍵按一下 T1000 Pacific Region.dsv的空白設計介面,然後選取 [新增具名查詢]。
[建立具名查詢] 對話方塊隨即出現。 重新輸入名稱,然後加入以下的描述:
名稱:
T1000 Pacific Region
描述: 依區域和模型篩選
vTimeSeries
在文字窗格中,輸入下列查詢,然後按一下 [確定]:
SELECT ReportingDate, ModelRegion, Quantity, Amount FROM dbo.vTimeSeries WHERE (ModelRegion = N'T1000 Pacific')
注意
因為您需要為各數列分別建立預測,您可能會想要複製查詢文字,並將它儲存到文字檔中,以便重複將它用於其他資料數列。
在 [資料來源檢視] 設計介面中,以滑鼠右鍵按一下 [T1000 Pacific],然後選取 [ 探索資料 ] 以確認資料已正確篩選。
在建立交叉預測查詢時,您將會使用此資料做為模型的輸入。