套用篩選
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
將篩選器套用至資料集的指定資料行
類別: 資料轉換/篩選
模組概觀
本文 descries 如何使用機器學習 Studio (傳統) 中的「套用篩選」模組,藉由套用先前定義的篩選來轉換值的資料行。 篩選準則用於數位信號處理,以減少雜訊或反白顯示模式。 因此,您轉換的值一律是數值,而且通常代表某種類型的音訊或視覺信號。
提示
您是否正在尋找不同類型的篩選? Studio (傳統) 提供這些模組來取樣資料、取得資料子集、移除不正確的值,或建立測試和定型集:分割資料、清除遺漏的資料、資料分割和樣本、套用SQL 轉換、剪輯值。 如果您需要在從來源讀取資料時篩選資料,請參閱匯 入資料。 選項取決於來源類型。
在判斷哪一種篩選準則最適合您的資料來源之後,您可以指定參數,並使用 [套用 篩選 ] 來轉換資料集。 因為篩選的設計與套用篩選的程序是分開的,所以篩選可重複使用。 例如,如果您經常處理用於預測的資料,您可以設計數種移動平均篩選來定型和比較多個模型。 您也可以儲存篩選,以套用到其他實驗或不同的資料集。
如何設定套用篩選
將 [套用 篩選 ] 模組新增至您的實驗。 您可以在 [篩選] 分類中的 [資料轉換] 下找到 IIR 篩選模組。
針對右邊的輸入,將包含數值的資料集連接到一個輸入。
若為左側輸入,請連接現有的篩選。 您可以重複使用儲存的篩選器,也可以使用下列其中一個篩選模組來設定篩選: 臨界值篩選、 移動平均篩選、中 位數篩選、 IIR 篩選、 杉樹篩選、 使用者定義篩選。
在 [套用篩選] 的 [屬性] 窗格中,按一下 [啟動資料行選取器],然後選擇應該套用篩選的資料行。
執行實驗,或以滑鼠右鍵按一下 [套用 篩選 ],然後按一下 [ 執行選取]。
結果
輸出只會包含所選資料行中的資料,並藉由套用指定的預先定義數學轉換進行轉換。
如果您想要查看資料集中的其他資料行,您可以使用 [ 加入資料行 ] 模組來合併原始和已篩選的資料集。
注意
原始資料行中的值尚未刪除或覆寫,而且在實驗中仍可供參考。 不過,篩選準則的輸出通常更適合用於模型化。
範例
如需如何在機器學習中使用篩選器的範例,請參閱 Azure AI 資源庫:
- 篩選:使用工程波形資料集,示範所有篩選類型。
技術說明
本節包含實作詳細資料、提示和常見問題集的解答。
[套用 篩選 ] 模組會將指定的篩選類型系結至選取的資料行。 如果您需要將不同類型的篩選套用至不同的資料行,您應該使用 資料集中的選取資料行 來隔離資料行,並在個別的工作流程中套用不同的篩選類型。 如需詳細資訊,請參閱 選取資料集中的資料行。
篩選不會通過未受篩選影響的資料行。 也就是說,「套用篩選」的輸出只包含已轉換的數值。 不過,您可以使用 [加入資料 行 ] 模組,將已轉換的值與源資料集聯結。
篩選期間
篩選期間取決於篩選類型,如下所示:
針對有限脈衝響應 (FIR)、簡單移動平均和三角形移動平均篩選,篩選期間為有限。
針對無限脈衝響應 (IIR)、指數移動平均和累計移動平均篩選,篩選期間為無限。
針對臨界值篩選,篩選期間一律為 1。
針對中位數篩選,不論篩選期間為何,輸入訊號中的 NaN 和遺漏值不會在輸出中產生新的 NaN。
遺漏值
本章節描述當遇到遺漏值時,依篩選類型的行為。 一般情況下,當篩選在輸入資料集中遇到 NaN 或遺漏值時,輸出資料集會根據篩選期間,以 Nan 作為下一個樣本數的期盼。 這會有下列結果:
杉樹、簡單的移動平均或三角形移動平均篩選準則有一段有限的時間。 如此一來,任何遺漏值後面都會加上等於篩選順序減一的 Nan 數目。
IIR、指數移動平均或累計移動平均篩選準則有無限期。 如此一來,在遇到第一個遺漏值之後,Nan 將會無限期地持續傳播。
在閾值篩選準則中,閾值篩選準則的期間為1。 如此一來,就不會傳播遺漏值和 Nan。
在中位數篩選中,不論篩選期間,輸入資料集中發現的 NaN 和遺漏值不會在輸出中產生新的 NaN。
預期的輸入
名稱 | 類型 | 描述 |
---|---|---|
Filter | IFilter 介面 | 濾波器實作 |
資料集 | 資料表 | 輸入資料集 |
如需 Studio (傳統) 模組特定的錯誤清單,請參閱機器學習錯誤碼。
如需 API 例外狀況的清單,請參閱機器學習 REST API 錯誤碼。
模組參數
名稱 | 範圍 | 類型 | 預設 | 描述 |
---|---|---|---|---|
資料行集 | 任意 | ColumnSelection | NumericAll | 選取要篩選的資料行 |
輸出
名稱 | 類型 | 說明 |
---|---|---|
結果資料集 | 資料表 | 輸出資料集 |