共用方式為


選取資料行轉換

本文說明如何在 Azure 機器學習 設計工具中使用 [選取數據行轉換] 元件。 選取數據行轉換元件的目的是要確保下游機器學習作業中使用一組可預測的一致數據行。

此元件對於評分等工作很有幫助,這些工作需要特定數據行。 可用資料行中的變更可能會中斷管線或變更結果。

您可以使用 [選取資料行轉換] 來建立及儲存一組數據行。 然後,使用 [ 套用轉換 ] 元件,將這些選取專案套用至新的數據。

如何使用選取資料行轉換

此案例假設您想要使用特徵選取來產生將用於定型模型的動態數據行集。 若要確保評分程式的數據行選取專案相同,您可以使用 [選取數據行轉換] 元件來擷取數據行選取專案,並將其套用至管線中的其他地方。

  1. 將輸入數據集新增至設計工具中的管線。

  2. 新增篩選型特徵選取實例。

  3. 連接元件並設定特徵選取元件,以在輸入數據集中自動尋找一些最佳功能。

  4. 新增定型模型的實例,並使用篩選型特徵選取輸出作為定型的輸入。

    重要

    由於特徵重要性是以數據行中的值為基礎,因此您無法事先知道哪些數據行可用於定型模型輸入

  5. 附加 [選取數據行轉換] 元件的實例。

    此步驟會產生數據行選取專案作為可儲存或套用至其他數據集的轉換。 此步驟可確保在特徵選取範圍中識別的數據行會儲存,以供其他元件重複使用。

  6. 新增評分模型元件。

    請勿連接輸入數據集。 請改為新增 [ 套用轉換 ] 元件,並連接特徵選取轉換的輸出。

    管線結構應該如下所示:

    範例管線

    重要

    您無法預期將篩選型特徵選取套用至評分數據集,並取得相同的結果。 因為特徵選取是以值為基礎,所以可能會選擇一組不同的數據行,這會導致評分作業失敗。

  7. 提交管線。

此儲存然後套用數據行選取的程式可確保相同的數據架構可用於定型和評分。

下一步

請參閱 Azure 機器學習 可用的元件集。