新增資料行
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
將一組資料行從某個資料集加入另一個資料集
類別: 資料轉換/操作
模組概觀
本文說明如何使用機器學習 Studio (傳統) 中的 [新增資料行] 模組串連兩個資料集。
您可以結合來自您指定為輸入的這兩個資料集的所有資料行,以建立單一資料集。 如果您需要串連兩個以上的資料集,請使用 [新增資料行] 的多個執行個體。
結合兩個包含不同資料列數目的資料集時,建議使用「 聯結資料 」模組,此模組支援一般索引鍵資料行的外部聯結。
如何設定新增資料行
將 [ 新增資料行 ] 模組新增至您的實驗。
連接您想要串連的兩個資料集。 如果您想要結合兩個以上的資料集,您可以將 [新增資料行] 的數個組合鏈結在一起。
您可以結合具有不同資料列數目的兩個資料行。 針對較小來源資料行中的每個資料列,會以遺漏值填補輸出資料集。
您無法選擇要新增的個別資料行。 使用 [新增資料行] 時,會串連來自每個資料集的所有資料行。 因此,如果您只想要加入資料行的子集,請使用 [ 資料集] 中的 [選取資料行 ],以您想要的資料行建立資料集。
執行實驗。
結果
執行實驗之後:
- 若要查看新資料集的第一個資料列,請以滑鼠右鍵按一下 [ 加入 資料行] 的輸出,然後選取 [ 視覺化]。
- 若要儲存並命名串連的資料集,請以滑鼠右鍵按一下輸出,然後選取 [ 另存為資料集 ]。
新資料集的資料行數目等於兩個輸入資料集的資料行總和。
如果輸入資料集有兩個具有相同名稱的資料行,則右側輸入資料行中使用的資料行資料行名稱會加上數值後置詞。 例如,如果名為 TargetOutcome 的資料行有兩個執行個體,則右側資料行會重新命名為 TargetOutcome (1)。
範例
如需如何在實驗中使用 [ 新增資料行 ] 的範例,請參閱 Azure AI 資源庫:
客戶關係預測:包含標籤的資料行會與特徵資料集結合。
Breast 癌症偵測:包含特徵的資料集會清除,然後使用 [加入資料列]、[加入資料行] 和 [聯結資料] 加以合併。
預期的輸入
名稱 | 類型 | 說明 |
---|---|---|
左邊資料集 | 資料表 | 左邊資料集 |
右邊資料集 | 資料表 | 右邊資料集 |
輸出
名稱 | 類型 | 說明 |
---|---|---|
結合的資料集 | 資料表 | 結合的資料集 |
例外狀況
例外狀況 | 描述 |
---|---|
錯誤 0003 | 如果一或多個輸入資料庫是 Null 或空白,就會發生例外狀況。 |
錯誤 0017 | 如果有一或多個指定資料行的類型不受目前模組的支援,就會發生例外狀況。 |
如需 Studio (傳統) 模組特定的錯誤清單,請參閱機器學習錯誤碼。
如需 API 例外狀況的清單,請參閱機器學習 REST API 錯誤碼。