機器學習-定型
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
本文說明機器學習 Studio (傳統) 中提供的模組,用來定型機器學習模型。 定型 是使用預先定義之模型的參數來分析輸入資料的流程。 從這個分析中,模型會學習模式,並以定型模型的形式儲存它們。
本文也說明機器學習 Studio (傳統) 建立模型、訓練、評估和評分的整體流程。
建立和使用機器學習模型
機器學習服務的一般工作流程包括下列階段:
- 選擇適當的演算法,並設定初始選項。
- 針對相容的資料定型模型。
- 根據模型中的模式,使用新的資料建立預測。
- 評估模型以判斷預測是否正確、有多少錯誤,以及是否有任何過度學習。
機器學習 Studio (傳統) 支援適用于機器學習的彈性、可自訂架構。 此程式中的每個工作都是由特定類型的模組所執行,這些類型可以修改、新增或移除,而不會中斷實驗的其餘部分。
此類別中的模組支援不同模型類型的定型。 在定型期間,資料會由機器學習演算法進行分析。 此演算法會分析資料的分佈和類型、編譯統計資料,並建立稍後可用於預測的模式。
深入瞭解模型定型
當機器學習正在定型模型時,就會略過具有遺漏值的資料列。 因此,如果您想要手動修正這些值、使用插補或指定不同的方法來處理遺漏值,請先使用「 清除遺漏的資料 」模組,再對資料集進行定型。
建議您使用 [ 編輯中繼資料 ] 模組來修正資料的任何其他問題。 您可能需要標記標籤資料行、變更資料類型或正確的資料行名稱。
針對其他常見的資料清除工作,例如正規化、取樣、分類收納和調整,請參閱 資料轉換 分類。
選擇適當的訓練員
您用來定型模型的方法,取決於您所建立的模型類型,以及模型所需的資料類型。 例如,機器學習提供專門用來定型異常偵測模型、建議模型等的模組。
檢查 定型模組的清單 ,以判斷哪一個對您的案例而言是正確的。
如果您不確定在定型模型時所使用的最佳參數,請使用提供的其中一個模組來進行參數清除和驗證:
微調模型超參數 可以在幾乎所有的分類和回歸模型上執行參數清理。 它會訓練多個模型,然後傳回最佳的模型。
在定型過程中,「 整理 叢集」模組支援模型調整,且僅適用于群集模型。 您可以指定距心範圍,並在自動偵測最佳參數時對資料進行定型。
交叉驗證模型模組也適用于模型優化,但不會傳回定型的模型。 相反地,它會提供您可用來決定最佳模型的計量。
重新定型模型
如果您需要重新定型生產模型,您可以隨時重新執行實驗。
您也可以使用 web 服務將重新訓練程式自動化。 如需逐步解說,請參閱使用 Azure Data Factory 重新定型和更新機器學習模型。
使用預先定型模型
機器學習包含一些預先定型的模型,例如預先定型 Cascade Image 分類模組。 您可以使用這些模型進行評分,而不需要額外的資料輸入。
此外,某些模組 (例如 時間序列異常偵測) 不會以 .ilearner 格式產生定型的模型。 但是,他們會在內部建立定型資料並建立模型,然後用它來進行預測。 若要使用這些參數,您只需要設定參數並提供資料。
儲存定型模型的快照集
如果您想要儲存或匯出模型,請以滑鼠右鍵按一下定型模組,然後選取 [ 另存為定型的模型]。 模型會匯出為 .Ilearner 格式,並儲存在您的工作區中的 定型模型下。 定型的模型可以在其他實驗中重複使用,或連接到其他模組以進行評分。
您也可以使用實驗中的「 載入定型模型 」模組來抓取預存模型。
模組清單
定型類別包含下列模組:
- 清理叢集:在叢集模型上執行參數清除,以判斷最佳的參數設定,並訓練最佳的模型。
- 定型異常偵測模型:定型異常偵測器模型,以及從定型集中標記資料。
- 定型群集模型:定型群集模型,並將定型集的資料指派給群集。
- 定型 Matchbox 推薦:使用 Matchbox 演算法訓練貝氏推薦。
- 定型模型:從定型集定型分類或回歸模型。
- 微調模型超參數:在回歸或分類模型上執行參數清除,以判斷最佳的參數設定,並訓練最佳的模型。
相關工作
某些模組不在此類別中,因為它們需要特殊格式或針對特定工作自訂: