二元平均感知器
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
建立平均認知二元分類模型
模組概觀
本文說明如何在機器學習 Studio (傳統) 中使用雙類別平均認知模組,以根據平均認知演算法建立機器學習模型。
此分類演算法是受監督的學習方法,並需要包含標籤資料行的已標記的資料集。 您可以將模型和加上標籤的資料集做為輸入來定型模型或調整模型超參數,藉以定型模型。 然後便可以使用定型的模型來預測新輸入範例的值。
深入瞭解平均認知模型
平均認知方法是早期且非常簡單的類神經網路版本。 此方法會根據線性函式,並結合一組衍生自特徵向量的權數,將輸入分類成幾個可能的輸出,因此才稱為「感知」。
較簡單的認知模型適合以線性方式學習可區分的模式,而類神經網路 (尤其是深度神經網路) 可以模型化更複雜的級別界限。 不過,感知器較快速,因為它們會循序處理案例,適用於連續定型。
如何設定二元平均感知器
將 雙類別平均認知 模組新增至您在 Studio (傳統) 中的實驗。
設定 [建立定型模式] 選項來指定要如何定型模型。
單一參數:如果您知道要如何設定模型,請提供一組特定值做為引數。
參數範圍:如果您不確定最佳參數,請指定多個值並使用 微調模型超參數 模組尋找最佳的設定,以找出最佳的參數。 講師會反復查看您所提供的多個設定組合,並判斷產生最佳模型的值組合。
針對學習速率,請指定學習速率的值。 學習速率值會控制在每次測試和更正模型時,隨機梯度下降中所使用的階梯大小。
藉由減少速率,模型將會較頻繁地測試,但有可能因此卡在高原期。 如果階梯較大,聚合速度會較快,但會有超過實際最小值的風險。
針對反覆運算次數上限,請輸入您希望演算法檢查訓練資料的次數。
早期停止常可帶來較佳的一般化。 增加反覆運算次數目可以改善配適性,但有可能過度配適。
針對亂數散播,可選擇性輸入要做為種子的整數值。 如果您想要確保實驗跨執行的重現性,建議使用種子。
選取 [ 允許未知的類別層級 ] 選項,在定型和驗證集中建立未知值的群組。 此模型對於已知值可能較不精確,但針對新的 (未知) 值可提供更佳的預測。
如果您取消選取此選項,則模型只會接受訓練資料中包含的值。
連線訓練資料集,以及其中一個訓練課程模組:
結果
定型完成後:
範例
如需如何使用這個學習演算法的範例,請參閱 Azure AI 資源庫:
- 二元分類器的交叉驗證範例:比較多個分類模型。
技術說明
本節包含實作詳細資料、提示和常見問題集的解答。
使用提示
對於此模型類型,最好先將資料集正規化之後,再用來定型分類器。 如需正規化選項,請參閱 標準化資料。
平均認知模型是早期的簡化版類神經網路。 因此,如果您的目標是速度重於精確性,此模型用於簡單的資料集將有良好的成效。 但是,如果您沒有得到想要的結果,請嘗試下列其中一個模型:
模組參數
名稱 | 範圍 | 類型 | 預設 | 描述 |
---|---|---|---|---|
學習率 | >=double.Epsilon | Float | 1.0 | 隨機梯度下降最佳化工具的初始學習速率。 |
反覆運算次數上限 | >=1 | 整數 | 10 | 在定型資料上執行的「隨機梯度下降」反覆運算次數。 |
亂數散播 | 任意 | 整數 | 模型使用的亂數產生器的種子。 保留空白代表預設值。 | |
允許不明類別層級 | 任意 | 布林值 | True | 如果為 True,則會為每個類別資料行建立額外層級。 測試資料集內若有任何層級是定型資料集內所有沒有的,則會對應到此額外層級。 |
輸出
名稱 | 類型 | 描述 |
---|---|---|
未定型的模型 | ILearner 介面 | 未定型的二元分類模型,可連接到 「一對多」多元分類、 定型模型或 交叉驗證模型 模組。 |