Compartir vía


fastForest: fastForest

Crea una lista que contiene el nombre de la función y los argumentos para entrenar un modelo de bosque rápido con rxEnsemble.

Uso

  fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
    exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
    numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
    trainThreads = 8, randomSeed = NULL, ...)
 

Argumentos

numTrees

Especifica el número total de árboles de decisión que se va a crear en el conjunto. Al crear más árboles de decisión, puede obtener una mejor cobertura, pero el tiempo de entrenamiento aumenta. El valor predeterminado es 100.

numLeaves

Número máximo de hojas (nodos terminales) que se pueden crear en un árbol. Valores más altos pueden aumentar el tamaño del árbol y mejorar la precisión, pero corre el riesgo de sobreajuste y de necesitar tiempos de entrenamiento más prolongados. El valor predeterminado es 20.

minSplit

Número mínimo de instancias de entrenamiento necesarias para formar una hoja. Es decir, el número mínimo de documentos permitidos en una hoja de un árbol de regresión, de los datos de submuestreo. Una división (split) significa que las características de cada nivel del árbol (nodo) se dividen de forma aleatoria. El valor predeterminado es 10.

exampleFraction

Fracción de instancias elegidas aleatoriamente que se usarán para cada árbol. El valor predeterminado es 0,7.

featureFraction

Fracción de características elegidas aleatoriamente que se usarán para cada árbol. El valor predeterminado es 0,7.

splitFraction

Fracción de características elegidas aleatoriamente que se usarán en cada división. El valor predeterminado es 0,7.

numBins

Número máximo de valores distintos (intervalos) por característica. El valor predeterminado es 255.

firstUsePenalty

Coeficiente de penalización del primer uso de una característica. El valor predeterminado es 0.

gainConfLevel

Requisito de confianza de la ganancia de ajuste del árbol (debe estar en el intervalo [0,1)). El valor predeterminado es 0.

trainThreads

Número de subprocesos que se usan en el entrenamiento. Si se especifica NULL, el número de subprocesos que se va a usar se determina internamente. El valor predeterminado es NULL.

randomSeed

Especifica la inicialización aleatoria. El valor predeterminado es NULL.

...

Argumentos adicionales.