多級促進式決策樹

發行項
09/01/2024

本文說明 Azure 機器學習設計工具中的元件。

使用此元件來建立以提升式判定樹演算法為基礎的機器學習模型。

提升式判定樹是一種合奏學習方法，其中第二個樹狀結構會針對第一個樹狀結構的錯誤進行更正，第三個樹狀結構會更正第一個和第二個樹狀結構的錯誤，依此類推。預測是以樹狀結構合奏為基礎。

如何設定

此元件會建立未定型分類模型。因為分類是監督式學習方法，因此您需要 標籤數據集 ，其中包含具有所有數據列值的標籤數據行。

您可以使用定型模型來定型這種類型的模型。

將 多類別提升判定樹 元件新增至管線。
藉由設定 [建立訓練器模式 ] 選項，指定您要如何定型模型。
- 單一參數：如果您知道如何設定模型，您可以提供一組特定的值做為自變數。
- 參數範圍：如果您不確定最佳參數，而且想要執行參數掃掠，請選取此選項。選取要逐一查看的值範圍，而微調模型超參數會逐一查看您提供之設定的所有可能組合，以判斷產生最佳結果的超參數。
每個樹狀結構的最大葉數會限制可在任何樹 狀結構中建立的終端節點數目上限。

藉由增加此值，您可能會增加樹狀結構的大小，並達到更高的精確度，風險是過度學習和較長的訓練時間。
每個分葉節點 的樣本數目下限，表示在樹狀結構中建立任何終端節點（分葉）所需的案例數目。

藉由增加此值，您可以增加建立新規則的臨界值。例如，預設值為 1，即使是單一案例，也會導致建立新的規則。如果您將值增加至 5，定型數據必須包含至少五個符合相同條件的案例。
學習速率 定義學習時的步驟大小。輸入介於 0 到 1 之間的數位。

學習速率會決定學習者在最佳解決方案上交集的速度或速度變慢。如果步驟大小太大，您可能會過度調整最佳解決方案。如果步驟大小太小，定型需要較長的時間才能交集到最佳解決方案上。
建構的樹狀結構數目表示在合奏中建立的判定樹總數。藉由建立更多判定樹，您可能會獲得更好的涵蓋範圍，但定型時間將會增加。
隨機數種子 選擇性地將非負整數設定為隨機種子值。指定種子可確保在具有相同數據和參數的執行之間重現性。

隨機種子預設會設定為 42。使用不同隨機種子的後續執行可能會有不同的結果。
定型模型：
- 如果您將 [建立定型器模式] 設定為 [單一參數]，請連接已標記的數據集和定型模型元件。
- 如果您將 [建立定型器模式] 設定為 [參數範圍]，請使用 [微調模型超參數] 連接已標記的數據集並定型模型。
注意

如果您將參數範圍傳遞至定型模型，它只會使用單一參數清單中的預設值。

如果您將單一參數值集合傳遞至微調模型超參數位件，當它預期每個參數的設定範圍時，它會忽略這些值，並使用學習者的預設值。

如果您選取 [ 參數範圍 ] 選項，並針對任何參數輸入單一值，即使您的其他參數在值範圍中變更，您指定的單一值也會在整個掃掠中使用。

下一步

請參閱 Azure 機器學習可用的元件集。

共用方式為

多級促進式決策樹

如何設定

下一步

意見反應

其他資源