自訂及處理預測模型 (中繼資料採礦教學課程)
Microsoft 時間序列演算法提供會影響模型建立方式的參數,以及分析時間資料的方式。 變更這些屬性會對採礦模型如何進行預測造成重大的影響。
在本教學課程的這項工作中,您將執行下列工作以修改模型:
您將藉由為 PERIODICITY_HINT 參數新增值,自訂模型處理時間週期的方式。
您將學習 Microsoft 時間序列演算法的兩個其他重要參數:FORECAST_METHOD 和 PREDICTION_SMOOTHING。前者讓您控制用於預測的方法,後者則讓您自訂長期和短期預測的混合。
您可以選擇告知演算法要如何計算遺漏值。
進行完所有變更之後,您將部署及處理模型。
設定時間序列參數
週期性提示
PERIODICITY_HINT參數會提供演算法,其中包含您預期在資料中看到的其他時間週期相關資訊。 根據預設,時間序列模型會嘗試自動在資料中偵測模式。 不過,如果您已經知道預期的時間循環,提供週期性提示可能會改進模型的精確度。 提供錯誤的週期性提示則可能會降低精確度;因此,如果您不確定應該使用哪個值,最好使用預設值。
例如,用於此模型的檢視會每月匯總 Adventure Works DW 多維度 2012 的銷售資料。 因此,模型所用的每個時間配量表示一個月,所有預測也是以月為單位。 由於一年中有 12 個月,而且您預期每年的銷售模式會重複更多或更少,所以您會將 PERIODICITY_HINT 參數設定為 12
,以指出 12 個時間配量 (個月) 構成一個完整的銷售週期。
預測方法
FORECAST_METHOD參數可控制時間序列演算法是否已針對短期或長期預測進行優化。 根據預設, FORECAST_METHOD 參數會設定為 MIXED,這表示混合和平衡兩種不同的演算法,以提供短期和長期預測的良好結果。
但是,如果您知道要使用特定的演算法,可以將值變更為 ARIMA 或 ARTXP。
加權Long-Term與Short-Term預測
您也可以使用 PREDICTION_SMOOTHING 參數來自訂長期和短期預測的混合方式。 依預設,此參數設為 0.5,一般而言可以提供整體精確度的最佳平衡。
若要變更演算法參數
在 [ 採礦模型] 索引標籤上,以滑鼠右鍵按一下 [ 預測],然後選取 [ 設定演算法參數]。
在 [
PERIODICITY_HINT
演算法參數 ] 對話方塊的資料列中,按一下 [ 值 ] 資料行,然後輸入{12}
,包括大括弧。根據預設,演算法也會加入 {1} 值。
在資料
FORECAST_METHOD
列中,確認 [ 值 ] 文字方塊是空白或設定為MIXED
。 如果輸入了不同的值,請輸入MIXED
,將參數變更回預設值。在 PREDICTION_SMOOTHING 列中,確認 [ 值 ] 文字方塊是空白或設定為 0.5。 如果輸入了不同的值,請按一下 [ 值 ],然後輸入
0.5
以將參數變更回預設值。注意
PREDICTION_SMOOTHING參數僅適用于 SQL Server Enterprise。 因此,您無法在 SQL Server Standard 中檢視或變更 PREDICTION_SMOOTHING 參數的值。 不過,預設行為是使用兩種演算法並且平均分配其權重。
按一下 [確定] 。
處理遺漏資料 (選擇性)
在許多情況下,您的銷售資料可能有填滿 Null 的間距,或可能有某分店錯過了報告期限,導致序列結尾處出現空白資料格。 在這種情況下,Analysis Services 會引發下列錯誤,且不會處理模型。
「資料採礦 (錯誤) :從採礦模型、模型 < 名稱 > 的數列 < 名稱 > 開始未同步處理的時間戳記。 所有時間序列都必須在同一個時間標示結束,且不能有任意遺漏資料點。 將 MISSING_VALUE_SUBSTITUTION 參數設定為 Previous 或數值常數,即可在適用時自動修補遺漏的資料點。」
若要避免此錯誤,您可以指定 Analysis Services 會自動提供新的值,以使用下列任一種方法填入間距:
使用平均值。 平均值是使用相同資料序列中的全部有效值來計算。
使用上一個值。 您可以將多個遺漏的資料格取代為上一個值,但是不可以填入起始值。
使用您套用的常數值。
若要指定以平均值填滿間距
在 [ 採礦模型] 索引標籤上,以滑鼠右鍵按一下 [預測] 資料行 ,然後選取 [ 設定演算法參數]。
在 [ 演算法參數 ] 對話方塊的 [MISSING_VALUE_SUBSTITUTION ] 資料列中,按一下 [ 值 ] 資料行,然後輸入
Mean
。
建立模型
若要使用模型,您必須將它部署至伺服器,然後透過演算法執行定型資料來處理模型。
若要處理預測模型
在SQL Server Data Tools的[採礦模型] 功能表上,選取 [處理採礦結構和所有模型]。
在詢問您是否要建置和部署專案的警告中,按一下 [ 是]。
在 [ 處理採礦結構 - 預測] 對話方塊中,按一下 [ 執行]。
[ 處理進度 ] 對話方塊隨即開啟,以顯示模型處理的相關資訊。 處理模型可能需要花一些時間。
處理完成後,按一下 [ 關閉 ] 結束 [ 處理進度 ] 對話方塊。
再次按一下 [關閉 ] 以結束 [ 處理採礦結構 - 預測] 對話方塊。