多類別羅吉斯回歸元件
本文說明 Azure 機器學習 設計工具中的元件。
使用此元件來建立羅吉斯回歸模型,可用來預測多個值。
使用羅吉斯回歸的分類是監督式學習方法,因此需要加上標籤的數據集。 您可以藉由提供模型和加上標籤的數據集作為訓練模型等 元件的輸入來定型模型。 然後,定型的模型可用來預測新輸入範例的值。
Azure 機器學習 也提供雙類別羅吉斯回歸元件,適用於二元或二分法變數的分類。
關於多類別羅吉斯回歸
羅吉斯回歸是一種已知的統計數據方法,可用來預測結果的機率,而且很適合分類工作使用。 演算法會藉由將數據調整至羅吉斯函式,來預測事件的發生機率。
在多類別羅吉斯回歸中,分類器可用來預測多個結果。
設定多類別羅吉斯回歸
將 多類別羅吉斯回歸 元件新增至管線。
藉由設定 [建立定型定型器模式 ] 選項,指定您要如何定型模型。
單一參數:如果您知道如何設定模型,並提供一組特定的值作為自變數,請使用此選項。
參數範圍:如果您不確定最佳參數,而且想要執行參數掃掠,請選取此選項。 選取要逐一查看的值範圍,而 微調模型超參數 會逐一查看您提供之設定的所有可能組合,以判斷產生最佳結果的超參數。
優化容錯,指定優化工具聚合的臨界值。 換句話說,如果反覆運算之間的改進少於臨界值,此演算法會停止,並傳回目前的模型。
L1 正規化權數、L2 正規化權數:輸入要用於正規化參數 L1 和 L2 的值。 建議針對兩者使用非零值。
正規化是一種防止過度學習的方法,方法是使用極端係數值來懲罰模型。 正規化的運作方式是將假設錯誤加上係數值相關聯的懲罰。 具有極端係數值的精確模型會受到較多懲罰,而具有較保守值的不精確模型受到較少懲罰。
L1 和 L2 正規化有不同的效果和使用。 L1 可以套用至疏鬆模型,這在處理高維度數據時很有用。 相反地,L2 正規化最好用於不疏鬆的數據。 此演算法支援 L1 和 L2 正規化值的線性組合:也就是說,如果
x = L1
y = L2
和 ,ax + by = c
則會定義正規化詞彙的線性範圍。L1 和 L2 詞彙的不同線性組合已針對羅吉斯回歸模型設計,例如 彈性 Net 正規化。
隨機數種子:如果您想要讓結果可重複執行,請輸入要當做演演算法種子使用的整數值。 否則,系統會使用系統時鐘值做為種子,這可以在相同管線的執行中產生稍微不同的結果。
連接標示的數據集,並定型模型:
如果您將 [建立定型器模式] 設定為 [單一參數],請連接已標記的數據集和定型模型元件。
如果您將 [建立定型器模式] 設定為 [參數範圍],請使用 [微調模型超參數] 連接已標記的數據集並定型模型。
提交管線。