自訂及處理預測模型 (中繼資料採礦教學課程)
Microsoft 時間序列演算法提供會影響模型建立方式以及時間資料分析方式的參數。您可以變更這些屬性,控制採礦模型如何進行預測。
為了本教學課程的這項工作,您將對參數進行下列變更:
- 您將調整 [預測] 模型的 PERIODICITY_HINT 參數值。這個參數會提供有關資料模式重複頻率的演算法資訊。AdventureWorks DW2008 中的資料是以月份為模式基礎,週期的層級是年份。因此,您會將 PERIODICITY_HINT 參數設為 12,指出模式每隔 12 個值後自動重複一次。
您還將檢閱 SQL Server 2008 新增的兩個重要參數的設定,這兩個參數增強了 Microsoft 時間序列演算法的功能。
FORECAST_METHOD 參數控制著時間序列演算法是否已針對短期或長期預測進行最佳化。依預設,FORECAST_METHOD 參數設為 MIXED,表示會平衡混合兩個不同的預測演算法,以執行短期和長期的預測。
PREDICTION_SMOOTHING 參數控制著長期和短期預測的混合方式。依預設,此參數設為 0.5,一般而言可以提供整體精確度的最佳平衡。
進行完變更之後,接著要處理模型。
若要變更演算法參數
在 [採礦模型] 索引標籤中,以滑鼠右鍵按一下 [預測],再選取 [設定演算法參數]。
在 [演算法參數] 對話方塊的 [PERIODICITY_HINT] 資料列中,按一下 [Value] 資料行,然後輸入 {12} (包括大括號)。
在 [FORECAST_METHOD] 資料列中,確認 [Value] 文字方塊不是空白就是設定為 MIXED。如果輸入了不同的值,請輸入 MIXED,將參數變更回預設值。
在 [PREDICTION_SMOOTHING] 資料列中,確認 [Value] 文字方塊不是空白就是設定為 0.5。如果輸入了不同的值,請按一下 [Value] 並輸入 0.5,將參數變更回預設值。
[!附註]
PREDICTION_SMOOTHING 參數只適用於 SQL Server Enterprise。因此,您無法在 SQL Server Standard 之中檢視或變更 PREDICTION_SMOOTHING 參數的值。不過,預設行為是相同的。
按一下 [確定]。
若要處理預測模型
在 BI Development Studio 的 [採礦模型] 功能表上,選取 [處理採礦結構和所有模型]。
當警告訊息詢問您是否想要建立及部署專案時,請按一下 [是]。
在 [處理採礦結構 – 預測] 對話方塊中,按一下 [執行]。
隨即開啟 [處理進度] 對話方塊,其中顯示處理模型的相關資訊。處理模型可能需要花一些時間。
在處理完成之後,按一下 [關閉] 以結束 [處理進度] 對話方塊。
再次按一下 [關閉],結束 [處理採礦結構 – 預測] 對話方塊。
處理遺漏資料 (選擇性)
在許多情況下,您的銷售資料可能有填滿 Null 的間距,或可能有某存放區錯過了報告期限,導致序列結尾處出現空白資料格。在這些情況下,Analysis Services 會發出下列錯誤,而且不處理模型。
「錯誤 (資料採礦):從採礦模型 <模型名稱> 的系列 <序列名稱> 起,時間戳記並未同步處理。所有時間序列都必須在同一個時間標示結束,且不能有任意遺漏資料點。將 MISSING_VALUE_SUBSTITUTION 參數設定為 Previous 或數值常數,即可在適用時自動修補遺漏的資料點。」
若要避免這個錯誤,您可以指定 Analysis Services 使用下列方法自動提供新值以填滿間距:
使用平均值。平均值是使用相同資料序列中的全部有效值來計算。
使用上一個值。您可以將多個遺漏的資料格取代為上一個值,但是不可以填入起始值。
使用您套用的常數值。
若要指定以平均值填滿間距
在 [採礦模型] 索引標籤中,以滑鼠右鍵按一下 [預測] 資料行,再選取 [設定演算法參數]。
在 [演算法參數] 對話方塊的 [MISSING_VALUE_SUBSTITUTION] 資料列中,按一下 [Value] 資料行,然後輸入 Mean。