移動平均濾波器
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
建立使資料平滑以利趨勢分析的移動平均篩選器
類別: 資料轉換/篩選
模組概觀
本文說明如何使用 機器學習 Studio (傳統) 中的移動平均篩選模組,使用您指定的視窗長度,計算資料集上一連串的一面或兩面平均。
定義符合您需求的篩選之後,您可以將它套用至資料集中的選取資料行,方法是將它連接到 [ 套用篩選 ] 模組。 模組會執行所有計算,並以對應的移動平均取代數值資料行內的值。
您可以使用產生的移動平均來繪圖和呈現視覺效果、做為模型化時新的平滑基準線、針對類似週期的計算來計算變異數等等。
提示
需要篩選資料集中的資料,或移除遺漏的值嗎? 請改用這些模組:
瞭解和使用移動平均
這種類型的平均可協助您在追溯和即時資料中揭露和預測實用的時序模式。 最簡單的移動平均類型始於數列的一些樣本,然後使用該位置加上前 n 個位置的平均值,而非實際的值 (您可以定義 n,就像您喜歡一樣。) 計算平均值的期間 n 越長,值之間會有較少的變異數。 此外,隨著您增加使用的值數目,產生的平均值就越不受任何單一值的影響。
移動平均可以是「單側」或「雙側」。 在單側平均值中,只會使用索引值之前的值。 在雙側平均值中,同時使用過去值和未來值。
在讀取串流資料的情況下,累積和加權移動平均特別有用。 累積移動平均將目前期間之前的點納入考量。
計算平均值時,您可以平均加權所有資料點,或者,您可以確保比較接近目前資料點的值加強權數。 在加權移動平均中,所有權數的總和必須等於 1。
在「指數移動平均」中,平均值包含「開頭」和「結尾」 (可加權)。 輕微加權的結尾表示結尾非常靠近開頭,因此平均就像是較短加權期間的移動平均。 當結尾的權數加重時,平均就很像是較長的簡單移動平均。
如何設定移動平均篩選
將 移動平均篩選 模組新增至實驗。 您可以在 [篩選] 類別的 [資料轉換] 底下找到此課程模組。
針對 [長度],輸入正整數值,定義套用篩選準則的視窗大小總計。 這也稱為篩選 遮罩。 對於移動平均,篩選的長度會決定滑動視窗中平均的值數目。
較長的篩選準則也稱為 較高順序 篩選準則,並提供較大的計算視窗,以及更接近趨勢線的近似值。
較短或 較低的順序 篩選準則會使用較小的計算視窗,並更類似原始資料。
針對 [類型],選擇要套用的移動平均類型。
機器學習 Studio (傳統) 支援下列類型的移動平均計算:
簡單:簡單的移動平均 (SMA) 會計算為未加權的滾動平均數。
三角形:三角形移動平均 (TMA) 平均兩次,以更平滑的趨勢線表示。 三角字衍生自套用至資料之權數的形狀,強調中央值。
指數簡單:指數移動平均 (EMA) 為最新的資料提供更多權數。 加權會以指數方式下降。
指數:經過修改的指數移動平均會計算執行中的移動平均,其中在任何一個點計算移動平均值時,都會考慮先前計算的所有前幾點的移動平均。 這個方法會產生更平滑的趨勢線。
累計:假設有單一點和目前的移動平均,則累計移動平均 (CMA) 計算目前點的移動平均。
新增具有您要計算移動平均值的資料集,並新增 [ 套用篩選] 模組。
連線 [套用篩選] 的左側輸入移動平均篩選,並將資料集連接到右側輸入。
在 [ 套用篩選] 模組中,使用資料行選取器來指定應該套用篩選的資料行。 根據預設,篩選轉換會套用至所有數值資料行,因此請務必排除任何沒有適當資料的資料行。
執行實驗。
針對篩選長度參數所定義的每組值,目前的 (或索引) 值會取代為移動平均值。
範例
如需如何在機器學習中使用篩選的範例,請參閱 Azure AI 資源庫中的此實驗:
- 篩選:此實驗示範所有篩選類型,使用工程的波狀資料集。
模組參數
名稱 | 範圍 | 類型 | 預設 | 描述 |
---|---|---|---|---|
長度 | >=1 | 整數 | 5 | 設定移動平均窗口的長度 |
類型 | 任意 | MovingAverageType | 指定要建立的移動平均類型 |
輸出
名稱 | 類型 | 描述 |
---|---|---|
Filter | IFilter 介面 | 濾波器實作 |