加入彙總預測模型 (中繼資料採礦教學課程)
您已經從預測模型的瀏覽得知,雖然大部分地區的銷售都遵循一個模式,但是某些地區和某些模型 (如太平洋地區的 M200 模型) 則呈現了非常不同的趨勢。地區之間的差異是很常見的,而且可能是因為許多因素所造成,其中包括促銷活動、不正確的報表或地理政治事件。
為了讓這些因素對預測的影響降至最低,您決定建立一個根據全球銷售彙總量值的通用採礦模型。然後您可以使用這個模型做預測,並將其套用到個別地區。最後,您將會比較各種產品所建立的預測。
為一般模型建立資料
建立此通用模型的第一個步驟是彙總全球銷售資料。其作法是建立特殊的資料來源檢視,該檢視會使用現有的資料來源,但是會執行類似總和或平均的計算。
若要使用自訂查詢或計算建立資料來源檢視
在 [方案總管] 中,以滑鼠右鍵按一下 [資料來源檢視],然後選取 [新增資料來源檢視]。
在精靈的歡迎頁面中,按 [下一步]。
在 [選取資料來源] 頁面上,選取 Adventure Works DW2008R2,然後按 [下一步]。
在 [選取資料表和檢視表] 頁面上,然後按 [下一步]。
在 [正在完成精靈] 頁面上,輸入 AllRegions 名稱,然後按一下 [完成]。
接下來,以滑鼠右鍵按一下空白的資料來源檢視設計介面,然後選取 [新增具名查詢]。
在 [建立具名查詢] 對話方塊中,針對 [名稱] 輸入 AllRegions,並針對 [描述] 輸入所有模型和地區的銷售總和與平均值。
在 SQL 文字窗格中,輸入下列陳述式:
SELECT ReportingDate, SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty, SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt, 'All Regions' as [Region] FROM dbo.vTimeSeries GROUP BY ReportingDate
按一下 [確定]。.
以滑鼠右鍵按一下 [AllRegions] 資料表,然後選取 [瀏覽資料]。
新的資料來源檢視包含全球所有產品的銷售總和與平均值。您也可以依照模型分組及彙總銷售,但是為了此教學課程的目的,您將會建立單一時間序列模型,您可以搭配地區或產品的任何組合使用這個模型進行預測。
在您建立了資料檢視以後,您必須建立新的採礦結構,然後根據該結構來建立採礦模型。現在您應該很熟悉如何建立採礦結構,因此,下列指引是經過簡化的。
若要使用彙總資料建立採礦結構和採礦模型
在 [方案總管] 中,以滑鼠右鍵按一下 [採礦結構],然後選取 [新增採礦結構],即可啟動資料採礦精靈。
在資料採礦精靈中,進行下列選擇:
演算法:Microsoft 時間序列
資料來源檢視:AllRegions
索引鍵:ReportingDate (Key Time) 和 Region (Key)
Input 和 Predict:AvgAmt、AvgQty、SumAmt、SumQty
採礦結構名稱:All Regions
採礦模型名稱:All Regions
處理此結構和模型。
檢視結果
當您決定哪一個模型要當做一般模型套用,以供全球預測使用之前,應該要進一步了解預測。當您在 Microsoft 時間序列檢視器中查看各種彙總數列的採礦模型和預測時,應該要想到幾個問題:
在 2006 年六月以前,每一條趨勢線幾乎都遵循相同的模式。從這一個時間點開始,數量線和金額線開始分歧。是什麼原因造成這項變更?
在 2008 年七月,這些線條又再次分歧。發生了什麼事?
請記得,M200 North America 數列的預測要比其他產品和地區高出許多。您很擔心這些預測可能不正確,而且併入這個數列可能會影響您所建立的一般模型。
在下一個工作中,您將會針對個別數列模型及根據彙總資料的模型來比較趨勢線和預測,以查看基礎資料如何影響模型。
如果您對於此模型的正確性感到滿意,而且不需要進一步了解結果,您可以跳至<使用平均預測模型進行預測 (中繼資料採礦教學課程)>工作。