Condividi tramite


fastTrees: fastTrees

Crea un elenco contenente il nome della funzione e gli argomenti per eseguire il training di un modello Fast Tree con rxEnsemble.

Utilizzo

  fastTrees(numTrees = 100, numLeaves = 20, learningRate = 0.2,
    minSplit = 10, exampleFraction = 0.7, featureFraction = 1,
    splitFraction = 1, numBins = 255, firstUsePenalty = 0,
    gainConfLevel = 0, unbalancedSets = FALSE, trainThreads = 8,
    randomSeed = NULL, ...)
 

Arguments

numTrees

Specifica il numero totale di alberi delle decisioni da creare nell'insieme. Creando più alberi delle decisioni, è possibile ottenere una migliore copertura, ma saranno necessari tempi di training prolungati. Il valore predefinito è 100.

numLeaves

Numero massimo di foglie (nodi di terminale) che è possibile creare in ogni albero. Valori più elevati aumentano potenzialmente le dimensioni dell'albero e consentono di ottenere una precisione migliore, ma rischiano di causare un overfitting e di richiedere tempi di training più lunghi. Il valore predefinito è 20.

learningRate

Determina le dimensioni del passaggio eseguito nella direzione del gradiente in ogni passaggio del processo di apprendimento. Questo valore determina quindi la velocità o la lentezza con cui lo strumento di apprendimento converge verso la soluzione ottimale. Se le dimensioni del passaggio sono eccessive, si rischia di oltrepassare la soluzione ottimale. Se la dimensione è troppo piccola, il training richiederà più tempo per convergere verso la soluzione migliore.

minSplit

Numero minimo di istanze di training necessarie per formare una foglia. Si tratta del numero minimo di documenti consentiti in una foglia di un albero di regressione, al di là dei dati sotto-campionati. Uno split indica che le funzionalità di ogni livello dell'albero (nodo) vengono divise in modo casuale. Il valore predefinito è 10. Viene conteggiato solo il numero di istanze, anche se le istanze sono ponderate.

exampleFraction

Frazione di istanze scelte in modo casuale da usare per ogni albero. Il valore predefinito è 0,7.

featureFraction

Frazione di funzionalità scelte in modo casuale da usare per ogni albero. Il valore predefinito è 1.

splitFraction

Frazione di funzionalità scelte in modo casuale da usare per ogni split. Il valore predefinito è 1.

numBins

Numero massimo di valori distinti (bin) per funzionalità. Se i valori della funzionalità sono di meno rispetto al numero indicato, ogni valore viene inserito nel bin corrispondente. Se sono presenti valori in più, l'algoritmo crea numBins bin.

firstUsePenalty

La funzionalità usa per primo il coefficiente di penalità. Si tratta di una forma di regolarizzazione che comporta una penalità per l'uso di una nuova funzionalità durante la creazione dell'albero. Aumentare questo valore per creare alberi che non usano molte funzionalità. Il valore predefinito è 0.

gainConfLevel

Requisito di attendibilità del guadagno di adattamento dell'albero. Il valore deve rientrare nell'intervallo [0,1]. Il valore predefinito è 0.

unbalancedSets

In caso di TRUE, vengono usati i derivati ottimizzati per i set non bilanciati. Si applica solo se type è uguale a "binary". Il valore predefinito è FALSE.

trainThreads

Numero di thread da usare nel training. Il valore predefinito è 8.

randomSeed

Specifica il valore di inizializzazione casuale. Il valore predefinito è NULL.

...

Argomenti aggiuntivi.