資料轉換
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
本文列出機器學習 Studio (傳統) 的資料轉換所提供的模組。 針對機器學習, 資料轉換 需要一些非常一般的工作,例如聯結資料集或變更資料行名稱。 但是,它也包含機器學習專用的許多工作,例如正規化、分類收納和群組,以及遺漏值的推斷。
重要
您在機器學習 Studio (傳統) 中使用的資料,在您將其匯入機器學習 Studio (傳統) 之前,通常預期會是「整齊」。 例如,資料準備可能包括確保資料使用正確的編碼,並檢查資料是否有一致的架構。
資料轉換的模組會分組為下列以工作為基礎的類別:
- 建立數位信號處理的篩選:數位信號篩選器可以套用至數值資料,以支援諸如影像辨識、語音辨識及波形分析等機器學習工作。
- 產生和使用以計數為基礎的功能:以計數為基礎的特徵化模組可協助您開發精簡功能,以在機器學習中使用。
- 一般資料操作和準備:合併資料集、清除遺漏值、群組和摘要資料、變更資料行名稱和資料類型,或指出哪個資料行是標籤或特徵。
- 取樣和分割資料集:將您的資料分成定型集和測試集、依百分比或依篩選準則分割資料集,或執行取樣。
- 調整和減少資料:藉由套用正規化或調整來準備要分析的數值資料。 將資料分類為群組、移除或取代極端值,或 (PCA) 執行主體元件分析。
模組清單
下列模組類別包含在 資料轉換 類別中: