選取資料行轉換
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
建立轉換,以選取與指定資料集中相同的資料行子集
類別: 資料轉換/操作
本文說明如何在機器學習 Studio (傳統) 中使用 [選取資料行] 轉換模組。 「 選取資料行」轉換 模組的目的是要確保下游機器學習作業一律使用可預測且一致的資料行集。
此模組特別適用于需要特定資料行的評分。 可用資料行中的變更可能會中斷實驗或變更結果。
您可以使用 [ 選取資料行] 轉換 來建立和儲存一組資料行。 然後,使用 [套用 轉換 ] 模組將這些選項套用至新的資料。
如何使用選取資料行轉換
此案例假設您想要使用特徵選取來產生一組將用來定型模型的動態資料行。 為確保評分程式的資料行選取專案相同,您可以使用 [ 選取資料行轉換 ] 模組來捕捉資料行選取專案,並將其套用至實驗中的其他位置。
在 Studio (傳統) 中,將輸入資料集新增至您的實驗。
針對篩選式特徵選取新增執行個體。
連線模組,並將 [特徵選取] 模組設定為自動在輸入資料集中尋找一些最佳功能。
新增訓練模型的執行個體,並使用篩選式特徵選取的輸出作為訓練的輸入。
重要
因為會根據資料行中的值決定特徵重要性,所以您無法事先知道哪些資料行可用於 定型模型的輸入。
現在,附加「 選取資料行」轉換 模組的實例。
這會產生一個資料行選取專案,做為可儲存或套用到其他資料集的轉換。 此步驟可確保儲存特徵選取所識別的資料行,以供其他模組重複使用。
新增 計分模型 模組。
請勿連結輸入資料集。
請改為加入「套用 轉換 」模組,然後連接「特徵選取」轉換的輸出。
重要
您無法預期將以 篩選器為基礎的特徵選取 套用至計分資料集,並取得相同的結果。 由於特徵選取是以值為基礎,因此它可能會選擇一組不同的資料行,這會導致計分作業失敗。
執行實驗。
儲存然後套用資料行選取的此程序,可確保用於訓練和評分的資料結構描述相同。
範例
如需如何使用此模組的範例,請參閱 Azure AI 資源庫:
選取資料行轉換:使用此課程模組的完整逐步解說。
篩選功能並將其從評分輸入移除:將此實驗儲存到您的工作區,以查看如何在完整的實驗性工作流程中使用模組。
預期的輸入
名稱 | 類型 | 說明 |
---|---|---|
具有所需資料行的資料集 | 資料表 | 包含所需資料行集的資料集 |
輸出
名稱 | 類型 | 說明 |
---|---|---|
資料行選取轉換 | ITransform 介面 | 此轉換會選取與指定資料集中相同的資料行子集。 |
例外狀況
例外狀況 | 描述 |
---|---|
錯誤 0003 | 如果一或多個輸入為 Null 或空白,就會發生例外狀況。 |