共用方式為


資料轉換

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

本文列出機器學習 Studio (傳統) 的資料轉換所提供的模組。 針對機器學習, 資料轉換 需要一些非常一般的工作,例如聯結資料集或變更資料行名稱。 但是,它也包含機器學習專用的許多工作,例如正規化、分類收納和群組,以及遺漏值的推斷。

注意

適用于僅限機器學習 Studio (傳統)

Azure Machine Learning 設計工具中提供類似的拖放模組。

重要

您在機器學習 Studio (傳統) 中使用的資料,在您將其匯入機器學習 Studio (傳統) 之前,通常預期會是「整齊」。 例如,資料準備可能包括確保資料使用正確的編碼,並檢查資料是否有一致的架構。

資料轉換的模組會分組為下列以工作為基礎的類別:

  • 建立數位信號處理的篩選:數位信號篩選器可以套用至數值資料,以支援諸如影像辨識、語音辨識及波形分析等機器學習工作。
  • 產生和使用以計數為基礎的功能:以計數為基礎的特徵化模組可協助您開發精簡功能,以在機器學習中使用。
  • 一般資料操作和準備:合併資料集、清除遺漏值、群組和摘要資料、變更資料行名稱和資料類型,或指出哪個資料行是標籤或特徵。
  • 取樣和分割資料集:將您的資料分成定型集和測試集、依百分比或依篩選準則分割資料集,或執行取樣。
  • 調整和減少資料:藉由套用正規化或調整來準備要分析的數值資料。 將資料分類為群組、移除或取代極端值,或 (PCA) 執行主體元件分析。

模組清單

下列模組類別包含在 資料轉換 類別中:

另請參閱