多級促進式決策樹
本文說明 Azure 機器學習 設計工具中的元件。
使用此元件來建立以提升式判定樹演算法為基礎的機器學習模型。
提升式判定樹是一種合奏學習方法,其中第二個樹狀結構會針對第一個樹狀結構的錯誤進行更正,第三個樹狀結構會更正第一個和第二個樹狀結構的錯誤,依此類推。 預測是以樹狀結構合奏為基礎。
如何設定
此元件會建立未定型分類模型。 因為分類是監督式學習方法,因此您需要 標籤數據集 ,其中包含具有所有數據列值的標籤數據行。
將 多類別提升判定樹 元件新增至管線。
藉由設定 [建立訓練器模式 ] 選項,指定您要如何定型模型。
單一參數:如果您知道如何設定模型,您可以提供一組特定的值做為自變數。
參數範圍:如果您不確定最佳參數,而且想要執行參數掃掠,請選取此選項。 選取要逐一查看的值範圍,而 微調模型超參數 會逐一查看您提供之設定的所有可能組合,以判斷產生最佳結果的超參數。
每個樹狀結構的最大葉數會限制可在任何樹 狀結構中建立的終端節點數目上限。
藉由增加此值,您可能會增加樹狀結構的大小,並達到更高的精確度,風險是過度學習和較長的訓練時間。
每個分葉節點 的樣本數目下限,表示在樹狀結構中建立任何終端節點(分葉)所需的案例數目。
藉由增加此值,您可以增加建立新規則的臨界值。 例如,預設值為 1,即使是單一案例,也會導致建立新的規則。 如果您將值增加至 5,定型數據必須包含至少五個符合相同條件的案例。
學習速率 定義學習時的步驟大小。 輸入介於 0 到 1 之間的數位。
學習速率會決定學習者在最佳解決方案上交集的速度或速度變慢。 如果步驟大小太大,您可能會過度調整最佳解決方案。 如果步驟大小太小,定型需要較長的時間才能交集到最佳解決方案上。
建構 的樹狀結構數目表示在合奏中建立的判定樹總數。 藉由建立更多判定樹,您可能會獲得更好的涵蓋範圍,但定型時間將會增加。
隨機數種子 選擇性地將非負整數設定為隨機種子值。 指定種子可確保在具有相同數據和參數的執行之間重現性。
隨機種子預設會設定為 42。 使用不同隨機種子的後續執行可能會有不同的結果。
定型模型:
如果您將 [建立定型器模式] 設定為 [單一參數],請連接已標記的數據集和定型模型元件。
如果您將 [建立定型器模式] 設定為 [參數範圍],請使用 [微調模型超參數] 連接已標記的數據集並定型模型。