fastForest: fastForest
rxEnsemble で FastForest モデルをトレーニングするための関数名と引数を含むリストを作成します。
使用方法
fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
trainThreads = 8, randomSeed = NULL, ...)
引数
numTrees
アンサンブルに作成するデシジョン ツリーの総数を指定します。 作成するデシジョン ツリーを増やすと、カバレッジが向上する可能性はありますが、トレーニング時間が長くなります。 既定値は 100 です。
numLeaves
ツリーに作成できるリーフ (終端ノード) の最大数。 値を大きくすると、ツリーのサイズが大きくなって精度が向上する可能性がありますが、オーバーフィットが発生し、トレーニング時間が長くなるリスクがあります。 既定値は 20 です。
minSplit
リーフを形成するために必要なトレーニング インスタンスの最小数。 つまり、サブサンプリングされたデータから、回帰ツリーのリーフで許可されるドキュメントの最小数です。 "分割" とは、ツリー (ノード) の各レベルの特徴がランダムに分割されることを意味します。 既定値は 10 です。
exampleFraction
各ツリーに使用するランダムに選択されたインスタンスの割合。 既定値は 0.7 です。
featureFraction
各ツリーに使用するランダムに選択された特徴の割合。 既定値は 0.7 です。
splitFraction
各分割に使用するランダムに選択された特徴の割合。 既定値は 0.7 です。
numBins
特徴ごとの個別の値 (ビン) の最大数。 既定値は 255 です。
firstUsePenalty
特徴の初回使用ペナルティ係数。 既定値は 0 です。
gainConfLevel
ツリー フィット ゲイン信頼度要件 ([0, 1) の範囲内である必要があります)。 既定値は 0 です。
trainThreads
トレーニングで使用するスレッドの数。 NULL
が指定された場合、使用するスレッドの数は内部的に決定されます。 既定値は NULL
です。
randomSeed
ランダム シードを指定します。 既定値は NULL
です。
...
追加の引数。