共用方式為


自訂及處理預測模型 (中繼資料採礦教學課程)

Microsoft 時間序列演算法提供會影響模型建立方式的參數,以及分析時間資料的方式。 變更這些屬性會對採礦模型如何進行預測造成重大的影響。

在本教學課程的這項工作中,您將執行下列工作以修改模型:

  1. 您將藉由為 PERIODICITY_HINT 參數新增值,自訂模型處理時間週期的方式。

  2. 您將學習 Microsoft 時間序列演算法的兩個其他重要參數:FORECAST_METHOD 和 PREDICTION_SMOOTHING。前者讓您控制用於預測的方法,後者則讓您自訂長期和短期預測的混合。

  3. 您可以選擇告知演算法要如何計算遺漏值。

  4. 進行完所有變更之後,您將部署及處理模型。

設定時間序列參數

週期性提示

PERIODICITY_HINT參數會提供演算法,其中包含您預期在資料中看到的其他時間週期相關資訊。 根據預設,時間序列模型會嘗試自動在資料中偵測模式。 不過,如果您已經知道預期的時間循環,提供週期性提示可能會改進模型的精確度。 提供錯誤的週期性提示則可能會降低精確度;因此,如果您不確定應該使用哪個值,最好使用預設值。

例如,用於此模型的檢視會每月匯總 Adventure Works DW 多維度 2012 的銷售資料。 因此,模型所用的每個時間配量表示一個月,所有預測也是以月為單位。 由於一年中有 12 個月,而且您預期每年的銷售模式會重複更多或更少,所以您會將 PERIODICITY_HINT 參數設定為 12 ,以指出 12 個時間配量 (個月) 構成一個完整的銷售週期。

預測方法

FORECAST_METHOD參數可控制時間序列演算法是否已針對短期或長期預測進行優化。 根據預設, FORECAST_METHOD 參數會設定為 MIXED,這表示混合和平衡兩種不同的演算法,以提供短期和長期預測的良好結果。

但是,如果您知道要使用特定的演算法,可以將值變更為 ARIMA 或 ARTXP。

加權Long-Term與Short-Term預測

您也可以使用 PREDICTION_SMOOTHING 參數來自訂長期和短期預測的混合方式。 依預設,此參數設為 0.5,一般而言可以提供整體精確度的最佳平衡。

若要變更演算法參數

  1. 在 [ 採礦模型] 索引標籤上,以滑鼠右鍵按一下 [ 預測],然後選取 [ 設定演算法參數]。

  2. 在 [ PERIODICITY_HINT演算法參數 ] 對話方塊的資料列中,按一下 [ ] 資料行,然後輸入 {12} ,包括大括弧。

    根據預設,演算法也會加入 {1} 值。

  3. 在資料 FORECAST_METHOD 列中,確認 [ ] 文字方塊是空白或設定為 MIXED 。 如果輸入了不同的值,請輸入 MIXED ,將參數變更回預設值。

  4. PREDICTION_SMOOTHING 列中,確認 [ ] 文字方塊是空白或設定為 0.5。 如果輸入了不同的值,請按一下 [ ],然後輸入 0.5 以將參數變更回預設值。

    注意

    PREDICTION_SMOOTHING參數僅適用于 SQL Server Enterprise。 因此,您無法在 SQL Server Standard 中檢視或變更 PREDICTION_SMOOTHING 參數的值。 不過,預設行為是使用兩種演算法並且平均分配其權重。

  5. 按一下 [確定] 。

處理遺漏資料 (選擇性)

在許多情況下,您的銷售資料可能有填滿 Null 的間距,或可能有某分店錯過了報告期限,導致序列結尾處出現空白資料格。 在這種情況下,Analysis Services 會引發下列錯誤,且不會處理模型。

「資料採礦 (錯誤) :從採礦模型、模型 < 名稱 > 的數列 < 名稱 > 開始未同步處理的時間戳記。 所有時間序列都必須在同一個時間標示結束,且不能有任意遺漏資料點。 將 MISSING_VALUE_SUBSTITUTION 參數設定為 Previous 或數值常數,即可在適用時自動修補遺漏的資料點。」

若要避免此錯誤,您可以指定 Analysis Services 會自動提供新的值,以使用下列任一種方法填入間距:

  • 使用平均值。 平均值是使用相同資料序列中的全部有效值來計算。

  • 使用上一個值。 您可以將多個遺漏的資料格取代為上一個值,但是不可以填入起始值。

  • 使用您套用的常數值。

若要指定以平均值填滿間距

  1. 在 [ 採礦模型] 索引標籤上,以滑鼠右鍵按一下 [預測] 資料行 ,然後選取 [ 設定演算法參數]。

  2. 在 [ 演算法參數 ] 對話方塊的 [MISSING_VALUE_SUBSTITUTION ] 資料列中,按一下 [ ] 資料行,然後輸入 Mean

建立模型

若要使用模型,您必須將它部署至伺服器,然後透過演算法執行定型資料來處理模型。

若要處理預測模型

  1. 在SQL Server Data Tools的[採礦模型] 功能表上,選取 [處理採礦結構和所有模型]。

  2. 在詢問您是否要建置和部署專案的警告中,按一下 [ ]。

  3. 在 [ 處理採礦結構 - 預測] 對話方塊中,按一下 [ 執行]。

    [ 處理進度 ] 對話方塊隨即開啟,以顯示模型處理的相關資訊。 處理模型可能需要花一些時間。

  4. 處理完成後,按一下 [ 關閉 ] 結束 [ 處理進度 ] 對話方塊。

  5. 再次按一下 [關閉 ] 以結束 [ 處理採礦結構 - 預測] 對話方塊。

本課程的下一項工作

探索預測模型 (中繼資料採礦教學課程)

另請參閱

Microsoft 時間序列演算法技術參考
Microsoft 時間序列演算法
處理需求和考量 (資料採礦)