定型模型
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
以監督方式為分類或迴歸模型定型
類別:機器學習/定型
模組概觀
本文描述如何使用機器學習 Studio (傳統) 中的「定型模型」模組來定型分類或回歸模型。 定型是在您定義模型並設定其參數之後進行,需要已標記的資料。 您也可以使用定型模型,以新的資料重新定型現有的模型。
定型流程的運作方式
在機器學習中,建立和使用機器學習模型通常是三個步驟的程式。
您可以選擇特定類型的演算法並定義其參數或超參數,以設定模型。 選擇下列任何模型類型:
提供已標記且資料與演算法相容的資料集。 將資料和模型都連線至定型模型。
定型產生的是特定的二進位格式 .ilearner,它會封裝從資料學習到的統計模式。 您無法直接修改或讀取此格式;不過,Studio (傳統) 中的其他模組可以使用此定型模型。
您也可以檢視模型的屬性。 如需詳細資訊,請參閱 結果 一節。
定型完成之後,請使用定型的模型搭配其中一個 評分模組,以對新資料進行預測。
注意
其他特製化的機器學習工作需要不同的定型方法,而 Studio (傳統) 為它們提供個別的定型模組。 例如,「影像偵測」、「叢集」和「異常 detction 全都使用自訂定型方法。 定型模型 僅適用于回歸和分類模型。
受監督和非監督式訓練
您可能聽說過受 監督 或 非監督式 學習的條款。 使用 定型模型 定型分類或回歸模型是受 監督機器學習的典型範例。 這表示您必須提供一個資料集,其中包含要從中學習模式的歷程記錄資料。 資料應該同時包含 (標籤) 您嘗試預測的結果,以及) (變數的相關因素。 機器學習模型需要結果,以判斷最能預測結果的功能。
在定型過程中,資料會依結果排序,而演算法會將統計模式解壓縮以建立模型。
非監督式 learning 表示結果不明,或您選擇不使用已知標籤。 例如,叢集演算法通常會採用非監督式學習方法,但可使用標籤(如果有的話)。 另一個範例是使用 LDA的主題模型。 您無法搭配這些演算法使用 定型模型 。
提示
機器學習服務的新手嗎? 本教學課程會逐步引導您取得資料、設定演算法、定型,然後使用模型的 程式:建立您的第一個機器學習實驗
如何使用 定型模型
在機器學習 Studio (傳統) 中,設定分類模型或回歸模型模型。
您也可以定型使用 Create R model建立的自訂模型。
將「 定型模型 」模組加入實驗中。 您可以在 [機器學習] 類別下找到此模組。 展開 [ 定型],然後將 [ 定型模型 ] 模組拖曳到您的實驗中。
在左側輸入中,附加未定型的模型。 將定型資料集附加至定型模型的右側輸入。
定型資料集必須包含標籤資料行。 任何不含標籤的資料列會被忽略。
針對 [ 標籤] 資料行,按一下 [ 啟動資料行選取器],然後選擇包含模型可用於定型之結果的單一資料行。
若為分類問題,標籤資料行必須包含分類值或離散值。 例子,是/否評等、疾病分類碼或名稱,或收入組別。 如果您挑選非類別資料行,此模組將會在定型期間傳回錯誤。
若為迴歸問題,標籤資料行必須包含數值資料,代表反應變數。 在觀念上,數值資料代表連續量表。
例如,信用風險分數、硬碟的故障預測時間,或預測客服中心在特定一天或時間的來電數。 如果不選擇數值資料行,可能會發生錯誤。
- 如果您未指定要使用哪個標籤資料行,機器學習將會使用資料集的中繼資料,嘗試推斷哪個是適當的標籤資料行。 如果挑選錯誤的資料行,請使用資料行選取器來修正。
提示
如果您使用資料行選取器時有困難,請參閱選取資料集的資料行一文中的秘訣。 其中描述一些常見的情節和 WITH RULES 和 BY NAME 選項的使用秘訣。
執行實驗。 如果您有大量資料,這可能需要一些時間。
結果
定型模型之後:
若要查看模型參數和功能加權,請以滑鼠右鍵按一下輸出,然後選取 [ 視覺化]。
若要在其他實驗中使用模型,請以滑鼠右鍵按一下模型,然後選取 [ 儲存模型]。 輸入模型的名稱。
這會將模型儲存為快照,而不會透過重複執行實驗來更新。
若要使用模型來預測新的值,請將它連接到「 評分模型 」模組,以及新的輸入資料。
相關工作
如果您需要訓練 定型模型不支援的模型類型,有幾個選項可供選擇:
使用 R 腳本建立自訂計分方法,或使用許多可用的 R 計分套件之一。
撰寫您自己的 Python 腳本來訓練和評分模型,或使用現有的 Python 程式庫:
異常偵測模型
- 定型異常偵測模型 可支援 Studio (傳統) 中的異常偵測模組。
建議模型
如果您的模型使用機器學習中提供的 Matchbox 建議,請使用 [定型 Matchbox 推薦] 模組。
叢集模型
範例
如需如何在機器學習實驗中使用「 定型模型 」模組的範例,請參閱 Azure AI 資源庫中的這些實驗:
預期的輸入
名稱 | 類型 | 描述 |
---|---|---|
未定型的模型 | ILearner 介面 | 未定型的學習模組 |
資料集 | 資料表 | 訓練資料 |
模組參數
名稱 | 範圍 | 類型 | 預設 | 描述 |
---|---|---|---|---|
標籤資料行 | 任意 | ColumnSelection | 選取包含標籤或結果資料行的資料行 |
輸出
名稱 | 類型 | Description |
---|---|---|
定型的模型 | ILearner 介面 | 定型的學習模組 |
例外狀況
如需所有模組錯誤的清單,請參閱 模組錯誤碼。
例外狀況 | 描述 |
---|---|
錯誤 0032 | 如果引數不是數字,就會發生例外狀況。 |
錯誤 0033 | 如果引數無限制,就會發生例外狀況。 |
錯誤 0083 | 如果用於定型的資料集不適用於具體類型的學習模組,就會發生例外狀況。 |
錯誤 0035 | 若未提供指定使用者或項目的特徵,就會發生例外狀況。 |
錯誤 0003 | 如果一或多個輸入為 Null 或空白,就會發生例外狀況。 |
錯誤 0020 | 如果傳至模組的某些資料集中的資料行數目太少,就會發生例外狀況。 |
錯誤 0021 | 如果傳至模組的某些資料集中的資料列數目太少,就會發生例外狀況。 |
錯誤 0013 | 如果傳遞給學習模組的類型無效,就會發生例外狀況。 |