logisticRegression: logisticRegression
rxEnsemble でロジスティック回帰モデルをトレーニングするための関数名と引数を含むリストを作成します。
使用方法
logisticRegression(l2Weight = 1, l1Weight = 1, optTol = 1e-07,
memorySize = 20, initWtsScale = 0, maxIterations = 2147483647,
showTrainingStats = FALSE, sgdInitTol = 0, trainThreads = NULL,
denseOptimizer = FALSE, ...)
引数
l2Weight
L2 正則化の重み。 値は 0
以上である必要があり、既定値は 1
に設定されています。
l1Weight
L1 正則化の重み。 値は 0
以上である必要があり、既定値は 1
に設定されています。
optTol
オプティマイザーの収束のしきい値。 イテレーション間の改善がしきい値を下回った場合に、アルゴリズムが終了して現在のモデルが返されます。 値が小さいほど低速ですが、精度は高くなります。 既定値は 1e-07
です。
memorySize
L-BFGS のメモリ サイズ。次のステップの計算用に保存する過去の位置と傾きの数を指定します。 この最適化パラメーターによって、次のステップの規模と方向の計算に使用されるメモリ量が制限されます。 指定するメモリ量を小さくすると、トレーニングにかかる時間は短縮されますが、正確さが低下します。 1
以上である必要があり、既定値は 20
です。
initWtsScale
初期重みの値の範囲を指定する初期の重みの直径を設定します。 これらの重みは、この範囲内からランダムに初期化されます。 たとえば、直径が d
に指定されている場合、重みは -d/2
と d/2
の間で一様に分布します。 既定値は 0
で、すべての重みが 0
に初期化されることを指定します。
maxIterations
イテレーションの最大数を設定します。 この数のステップを実行すると、収束条件を満たしていなくてもアルゴリズムは停止します。
showTrainingStats
トレーニング データの統計とトレーニング済みモデルを表示する場合は TRUE
、それ以外の場合は FALSE
を指定します。 既定値は FALSE
です。 モデルの統計の詳細については、「summary.mlModel」を参照してください。
sgdInitTol
確率的勾配降下法 (SGD) を使用して初期パラメーターを検索する場合は、0 より大きい数値に設定します。 0 以外の値を設定すると、収束を決定するために SGD で使用される許容範囲が指定されます。 既定値は 0
であり、SGD を使用しないことを指定します。
trainThreads
モデルのトレーニングに使用するスレッドの数。 これは、コンピューターのコア数に設定する必要があります。 L-BFGS マルチスレッドでは、データ セットをメモリに読み込もうとすることに注意してください。 メモリ不足の問題が発生した場合は、trainThreads
を 1
に設定してマルチスレッド処理をオフにします。 NULL
が指定された場合、使用するスレッドの数は内部的に決定されます。 既定値は NULL
です。
denseOptimizer
TRUE
の場合、内部最適化ベクターを強制的に高密度化します。 FALSE
の場合、ロジスティック回帰オプティマイザーで適切と見なされたスパースまたは高密度の内部状態を使用できるようにします。 denseOptimizer
を TRUE
に設定するには、内部オプティマイザーで高密度の内部状態を使用する必要があります。これにより、大きな問題が発生した場合に、ガベージ コレクターの負荷を軽減することができます。
...
追加の引数。