共用方式為


多級促進式決策樹

本文說明 Azure 機器學習 設計工具中的元件。

使用此元件來建立以提升式判定樹演算法為基礎的機器學習模型。

提升式判定樹是一種合奏學習方法,其中第二個樹狀結構會針對第一個樹狀結構的錯誤進行更正,第三個樹狀結構會更正第一個和第二個樹狀結構的錯誤,依此類推。 預測是以樹狀結構合奏為基礎。

如何設定

此元件會建立未定型分類模型。 因為分類是監督式學習方法,因此您需要 標籤數據集 ,其中包含具有所有數據列值的標籤數據行。

您可以使用定型模型來定型這種類型的模型

  1. 多類別提升判定樹 元件新增至管線。

  2. 藉由設定 [建立訓練器模式 ] 選項,指定您要如何定型模型。

    • 單一參數:如果您知道如何設定模型,您可以提供一組特定的值做為自變數。

    • 參數範圍:如果您不確定最佳參數,而且想要執行參數掃掠,請選取此選項。 選取要逐一查看的值範圍,而 微調模型超參數 會逐一查看您提供之設定的所有可能組合,以判斷產生最佳結果的超參數。

  3. 每個樹狀結構的最大葉數會限制可在任何樹 狀結構中建立的終端節點數目上限。

    藉由增加此值,您可能會增加樹狀結構的大小,並達到更高的精確度,風險是過度學習和較長的訓練時間。

  4. 每個分葉節點 的樣本數目下限,表示在樹狀結構中建立任何終端節點(分葉)所需的案例數目。

    藉由增加此值,您可以增加建立新規則的臨界值。 例如,預設值為 1,即使是單一案例,也會導致建立新的規則。 如果您將值增加至 5,定型數據必須包含至少五個符合相同條件的案例。

  5. 學習速率 定義學習時的步驟大小。 輸入介於 0 到 1 之間的數位。

    學習速率會決定學習者在最佳解決方案上交集的速度或速度變慢。 如果步驟大小太大,您可能會過度調整最佳解決方案。 如果步驟大小太小,定型需要較長的時間才能交集到最佳解決方案上。

  6. 建構 的樹狀結構數目表示在合奏中建立的判定樹總數。 藉由建立更多判定樹,您可能會獲得更好的涵蓋範圍,但定型時間將會增加。

  7. 隨機數種子 選擇性地將非負整數設定為隨機種子值。 指定種子可確保在具有相同數據和參數的執行之間重現性。

    隨機種子預設會設定為 42。 使用不同隨機種子的後續執行可能會有不同的結果。

  8. 定型模型:

    注意

    如果您將參數範圍傳遞至 定型模型,它只會使用單一參數清單中的預設值。

    如果您將單一參數值集合傳遞至 微調模型超參數位 件,當它預期每個參數的設定範圍時,它會忽略這些值,並使用學習者的預設值。

    如果您選取 [ 參數範圍 ] 選項,並針對任何參數輸入單一值,即使您的其他參數在值範圍中變更,您指定的單一值也會在整個掃掠中使用。

下一步

請參閱 Azure 機器學習 可用的元件集。