共用方式為


資料轉換 - 篩選

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

本文說明如何使用 機器學習 Studio 中的篩選模組, (傳統) 來轉換數位資料。 此適用于 機器學習 Studio (傳統) 工具群組中的模組是以針對數位訊號處理技術開發的篩選為基礎。

注意

適用于僅限機器學習 Studio (傳統)

Azure Machine Learning設計工具中提供類似的拖放模組。

篩選通常會套用至資料處理階段或前置處理階段中的資料。 篩選可增強用於機器學習的訊號清楚。 例如,您可以在 機器學習 Studio 中使用篩選模組, (傳統) 來進行這些處理工作:

  • 清除用於語音辨識的電壓。
  • 在含有雜訊的銷售或經濟資料中偵測趨勢或移除季節性效應。
  • 分析遙測訊號中的模式或成品。

這些模組會使用經過妥善研究的演算法,以數學方式轉換電壓資料,提供簡單的篩選設定。 如果您已經決定要套用至資料的正確係數,您也可以建立自訂濾波器。

如果您需要依資料列從資料集中排除資料、移除遺漏值或減少資料集大小等工作,請改用下列模組:

  • 清除遺漏的資料:移除遺漏的值,或使用預留位置取代遺漏的值。
  • 資料分割和範例:使用日期範圍、特定值或正則運算式等準則來分割或篩選資料集。
  • 裁剪值:設定值範圍,並只保留該範圍內的值。

數位訊號處理中的篩選

就像您可以將篩選附加至相機以補償光源或建立特殊效果一樣,您可以將篩選套用至您用於機器學習的資料。 篩選可協助改善訊號的清楚性、擷取有趣的特性,或減少雜訊。

理想的篩選準則會消除所有雜訊,並針對所需的訊號具有統一的敏感度。 但是,甚至設計相當良好的篩選,可能需要許多反復專案或技術組合。 如果您成功設計有效的篩選,請考慮儲存篩選準則,以便在轉換新資料時重複使用。

一般而言,篩選是根據波形分析的原理。 設計篩選時,您會尋找隱藏或放大訊號部分的方法、公開基礎趨勢、減少雜訊和干擾,或識別可能未察覺的資料值。

各種技術會套用至分解個別趨勢或產生實際資料值的電壓元件。 您可以使用三角函數來識別和隔離個別的電壓,來分析一系列的值。 (這確實是非對稱數列或音訊訊號的複合頻率。) 篩選器接著可以套用至這些電壓,以消除雜訊、放大某些波或移除目標群組件。

在篩選含有雜訊的數列以隔離不同的分量時,您可以指定要處理的頻帶,以指定要移除或強化的頻率。

機器學習 Studio 中的數位篩選器 (傳統)

機器學習 Studio (傳統) 支援下列類型的篩選:

  • 根據變形分解的篩選。 範例包括有限脈衝回應 (FIR) 和無限脈衝回應 (IIR) 篩選準則。 這些篩選器的運作方式是從整體數列移除特定元件。 然後,您可以檢視並調查簡化的電壓。
  • 根據移動平均值或中間值的濾波器。 這些濾波器可平均分配時間窗口,以減低資料數列中的變異。 窗口可以固定或滑動,且可以有不同的形狀。 例如,三角形窗口以目前的資料點為最高峰 (加重目前值的權數),在此資料點的前後逐漸下降 (減少前後值的權數)。
  • 使用者定義或自訂的濾波器。 如果您已經知道應該套用至資料數列的轉換,您可以建立使用者定義的篩選。 您可以提供套用以轉換資料數列的數值係數。 自訂篩選可以模擬 FIR 或 IIR 篩選準則。 不過,使用自訂篩選,您可以更充分掌控數列中每個點所要套用的值。

篩選術語

下列清單包含篩選參數和屬性中使用的詞彙簡單定義:

  • Passband:可在不衰減或降低的情況下通過篩選的頻率範圍。
  • Stopband:指定限制之間的頻率範圍,不會通過訊號。 您可以設定截止頻率來定義阻帶。
  • 高傳遞:只允許高頻率通過。
  • 低傳遞:只接受低於指定截斷值的頻率。
  • 角落:定義停止帶和通帶頻率之間的界限。 通常,您可以決定頻帶是否包含或排除轉角。 第一個順序篩選準則會導致逐漸衰減,直到角落頻率為止。 之後,篩選準則會造成指數衰減。 較高順序的篩選 (,例如,在角落頻率之後,) 的 Chebyshev 篩選) 有較斜率。 高階篩選準則會更快速且完整地衰減停止帶中的值。
  • Bandstop 篩選 (也稱為 頻外拒絕 篩選準則或 ) :只有一個停駐點。 您可以藉由指定兩個頻率來定義停止帶:高截斷頻率和低截止頻率。 bandpass篩選通常有兩個停止帶:一個位於所需元件的任一端。
  • 波紋:定期發生的小型垃圾變化。 在機器學習中,您可以在 IIR 篩選設計中指定要容忍的參數數量。

提示

需要更多資訊嗎? 如果您不熟悉數位訊號處理,請參閱 數位訊號處理簡介。 網站提供定義和實用的視覺輔助工具,說明基本術語和概念。

模組清單

下列模組包含在 資料轉換 - 篩選 類別中:

另請參閱