資料轉換 - 篩選
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
本文說明如何使用 機器學習 Studio 中的篩選模組, (傳統) 來轉換數位資料。 此適用于 機器學習 Studio (傳統) 工具群組中的模組是以針對數位訊號處理技術開發的篩選為基礎。
篩選通常會套用至資料處理階段或前置處理階段中的資料。 篩選可增強用於機器學習的訊號清楚。 例如,您可以在 機器學習 Studio 中使用篩選模組, (傳統) 來進行這些處理工作:
- 清除用於語音辨識的電壓。
- 在含有雜訊的銷售或經濟資料中偵測趨勢或移除季節性效應。
- 分析遙測訊號中的模式或成品。
這些模組會使用經過妥善研究的演算法,以數學方式轉換電壓資料,提供簡單的篩選設定。 如果您已經決定要套用至資料的正確係數,您也可以建立自訂濾波器。
相關工作
如果您需要依資料列從資料集中排除資料、移除遺漏值或減少資料集大小等工作,請改用下列模組:
數位訊號處理中的篩選
就像您可以將篩選附加至相機以補償光源或建立特殊效果一樣,您可以將篩選套用至您用於機器學習的資料。 篩選可協助改善訊號的清楚性、擷取有趣的特性,或減少雜訊。
理想的篩選準則會消除所有雜訊,並針對所需的訊號具有統一的敏感度。 但是,甚至設計相當良好的篩選,可能需要許多反復專案或技術組合。 如果您成功設計有效的篩選,請考慮儲存篩選準則,以便在轉換新資料時重複使用。
一般而言,篩選是根據波形分析的原理。 設計篩選時,您會尋找隱藏或放大訊號部分的方法、公開基礎趨勢、減少雜訊和干擾,或識別可能未察覺的資料值。
各種技術會套用至分解個別趨勢或產生實際資料值的電壓元件。 您可以使用三角函數來識別和隔離個別的電壓,來分析一系列的值。 (這確實是非對稱數列或音訊訊號的複合頻率。) 篩選器接著可以套用至這些電壓,以消除雜訊、放大某些波或移除目標群組件。
在篩選含有雜訊的數列以隔離不同的分量時,您可以指定要處理的頻帶,以指定要移除或強化的頻率。
機器學習 Studio 中的數位篩選器 (傳統)
機器學習 Studio (傳統) 支援下列類型的篩選:
- 根據變形分解的篩選。 範例包括有限脈衝回應 (FIR) 和無限脈衝回應 (IIR) 篩選準則。 這些篩選器的運作方式是從整體數列移除特定元件。 然後,您可以檢視並調查簡化的電壓。
- 根據移動平均值或中間值的濾波器。 這些濾波器可平均分配時間窗口,以減低資料數列中的變異。 窗口可以固定或滑動,且可以有不同的形狀。 例如,三角形窗口以目前的資料點為最高峰 (加重目前值的權數),在此資料點的前後逐漸下降 (減少前後值的權數)。
- 使用者定義或自訂的濾波器。 如果您已經知道應該套用至資料數列的轉換,您可以建立使用者定義的篩選。 您可以提供套用以轉換資料數列的數值係數。 自訂篩選可以模擬 FIR 或 IIR 篩選準則。 不過,使用自訂篩選,您可以更充分掌控數列中每個點所要套用的值。
篩選術語
下列清單包含篩選參數和屬性中使用的詞彙簡單定義:
- Passband:可在不衰減或降低的情況下通過篩選的頻率範圍。
- Stopband:指定限制之間的頻率範圍,不會通過訊號。 您可以設定截止頻率來定義阻帶。
- 高傳遞:只允許高頻率通過。
- 低傳遞:只接受低於指定截斷值的頻率。
- 角落:定義停止帶和通帶頻率之間的界限。 通常,您可以決定頻帶是否包含或排除轉角。 第一個順序篩選準則會導致逐漸衰減,直到角落頻率為止。 之後,篩選準則會造成指數衰減。 較高順序的篩選 (,例如,在角落頻率之後,) 的 Chebyshev 篩選) 有較斜率。 高階篩選準則會更快速且完整地衰減停止帶中的值。
- Bandstop 篩選 (也稱為 頻外拒絕 篩選準則或 ) :只有一個停駐點。 您可以藉由指定兩個頻率來定義停止帶:高截斷頻率和低截止頻率。 bandpass篩選通常有兩個停止帶:一個位於所需元件的任一端。
- 波紋:定期發生的小型垃圾變化。 在機器學習中,您可以在 IIR 篩選設計中指定要容忍的參數數量。
提示
需要更多資訊嗎? 如果您不熟悉數位訊號處理,請參閱 數位訊號處理簡介。 網站提供定義和實用的視覺輔助工具,說明基本術語和概念。
模組清單
下列模組包含在 資料轉換 - 篩選 類別中:
- 套用篩選:將篩選套用至資料集的指定資料行。
- FIR 篩選:建立用於訊號處理的 FIR 篩選器。
- IIR 篩選:建立用於訊號處理的 IIR 篩選準則。
- 中位數篩選:建立中位數篩選準則,用來平滑資料以進行趨勢分析。
- 移動平均篩選:建立移動平均篩選,以平滑處理資料以進行趨勢分析。
- 臨界值篩選:建立限制值的臨界值篩選。
- 使用者定義的篩選:建立自訂 FIR 或 IIR 篩選準則。