次の方法で共有


fastForest: fastForest

rxEnsemble で FastForest モデルをトレーニングするための関数名と引数を含むリストを作成します。

使用方法

  fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
    exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
    numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
    trainThreads = 8, randomSeed = NULL, ...)
 

引数

numTrees

アンサンブルに作成するデシジョン ツリーの総数を指定します。 作成するデシジョン ツリーを増やすと、カバレッジが向上する可能性はありますが、トレーニング時間が長くなります。 既定値は 100 です。

numLeaves

ツリーに作成できるリーフ (終端ノード) の最大数。 値を大きくすると、ツリーのサイズが大きくなって精度が向上する可能性がありますが、オーバーフィットが発生し、トレーニング時間が長くなるリスクがあります。 既定値は 20 です。

minSplit

リーフを形成するために必要なトレーニング インスタンスの最小数。 つまり、サブサンプリングされたデータから、回帰ツリーのリーフで許可されるドキュメントの最小数です。 "分割" とは、ツリー (ノード) の各レベルの特徴がランダムに分割されることを意味します。 既定値は 10 です。

exampleFraction

各ツリーに使用するランダムに選択されたインスタンスの割合。 既定値は 0.7 です。

featureFraction

各ツリーに使用するランダムに選択された特徴の割合。 既定値は 0.7 です。

splitFraction

各分割に使用するランダムに選択された特徴の割合。 既定値は 0.7 です。

numBins

特徴ごとの個別の値 (ビン) の最大数。 既定値は 255 です。

firstUsePenalty

特徴の初回使用ペナルティ係数。 既定値は 0 です。

gainConfLevel

ツリー フィット ゲイン信頼度要件 ([0, 1) の範囲内である必要があります)。 既定値は 0 です。

trainThreads

トレーニングで使用するスレッドの数。 NULL が指定された場合、使用するスレッドの数は内部的に決定されます。 既定値は NULL です。

randomSeed

ランダム シードを指定します。 既定値は NULL です。

...

追加の引数。