fastForest: fastForest

[アーティクル]
05/23/2023

rxEnsemble で FastForest モデルをトレーニングするための関数名と引数を含むリストを作成します。

使用方法

  fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
    exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
    numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
    trainThreads = 8, randomSeed = NULL, ...)

引数

`numTrees`

アンサンブルに作成するデシジョンツリーの総数を指定します。作成するデシジョンツリーを増やすと、カバレッジが向上する可能性はありますが、トレーニング時間が長くなります。既定値は 100 です。

`numLeaves`

ツリーに作成できるリーフ (終端ノード) の最大数。値を大きくすると、ツリーのサイズが大きくなって精度が向上する可能性がありますが、オーバーフィットが発生し、トレーニング時間が長くなるリスクがあります。既定値は 20 です。

`minSplit`

リーフを形成するために必要なトレーニングインスタンスの最小数。つまり、サブサンプリングされたデータから、回帰ツリーのリーフで許可されるドキュメントの最小数です。 "分割" とは、ツリー (ノード) の各レベルの特徴がランダムに分割されることを意味します。既定値は 10 です。

`exampleFraction`

各ツリーに使用するランダムに選択されたインスタンスの割合。既定値は 0.7 です。

`featureFraction`

各ツリーに使用するランダムに選択された特徴の割合。既定値は 0.7 です。

`splitFraction`

各分割に使用するランダムに選択された特徴の割合。既定値は 0.7 です。

`numBins`

特徴ごとの個別の値 (ビン) の最大数。既定値は 255 です。

`firstUsePenalty`

特徴の初回使用ペナルティ係数。既定値は 0 です。

`gainConfLevel`

ツリーフィットゲイン信頼度要件 ([0, 1) の範囲内である必要があります)。既定値は 0 です。

`trainThreads`

トレーニングで使用するスレッドの数。 NULL が指定された場合、使用するスレッドの数は内部的に決定されます。既定値は NULL です。

`randomSeed`

ランダムシードを指定します。既定値は NULL です。

`...`

追加の引数。

次の方法で共有