Compartir vía


fastTrees: fastTrees

Crea una lista que contiene el nombre de la función y los argumentos para entrenar un modelo FastTree con rxEnsemble.

Uso

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)
 

Argumentos

numTrees

Especifica el número total de árboles de decisión que se va a crear en el conjunto. Al crear más árboles de decisión, puede obtener una mejor cobertura, pero el tiempo de entrenamiento aumenta. El valor predeterminado es 100.

numLeaves

Número máximo de hojas (nodos terminales) que se pueden crear en un árbol. Valores más altos pueden aumentar el tamaño del árbol y mejorar la precisión, pero corre el riesgo de sobreajuste y de necesitar tiempos de entrenamiento más prolongados. El valor predeterminado es 20.

learningRate

Determina el tamaño del paso realizado en la dirección del gradiente en cada paso del proceso de aprendizaje. Esto determina la rapidez o lentitud con la que el aprendiz encuentra la solución óptima. Si el tamaño del paso es demasiado grande, puede pasar por alto la solución óptima. Si el tamaño del paso es demasiado pequeño, el entrenamiento tarda más tiempo en conseguir la mejor solución.

minSplit

Número mínimo de instancias de entrenamiento necesarias para formar una hoja. Es decir, el número mínimo de documentos permitidos en una hoja de un árbol de regresión, de los datos de submuestreo. Una división (split) significa que las características de cada nivel del árbol (nodo) se dividen de forma aleatoria. El valor predeterminado es 10. Solo se cuenta el número de instancias, incluso si están ponderadas.

exampleFraction

Fracción de instancias elegidas aleatoriamente que se usarán para cada árbol. El valor predeterminado es 0,7.

featureFraction

Fracción de características elegidas aleatoriamente que se usarán para cada árbol. El valor predeterminado es 1.

splitFraction

Fracción de características elegidas aleatoriamente que se usarán en cada división. El valor predeterminado es 1.

numBins

Número máximo de valores distintos (intervalos) por característica. Si la característica tiene menos valores que el número indicado, cada valor se pone en su propio rango. Si hay más valores, el algoritmo crea numBins intervalos.

firstUsePenalty

Coeficiente de penalización del primer uso de una característica. Es una forma de regularización que genera una penalización por usar una nueva característica al crear el árbol. Aumente este valor para crear árboles que no usen muchas características. El valor predeterminado es 0.

gainConfLevel

Requisito de confianza de la ganancia de ajuste del árbol (debe estar en el intervalo [0,1)). El valor predeterminado es 0.

unbalancedSets

Si es TRUE, se usan derivadas optimizadas para conjuntos desequilibrados. Solo es aplicable cuando type es igual a "binary". El valor predeterminado es FALSE.

trainThreads

Número de subprocesos que se usan en el entrenamiento. El valor predeterminado es 8.

randomSeed

Especifica la inicialización aleatoria. El valor predeterminado es NULL.

...

Argumentos adicionales.