Поделиться через


fastForest: fastForest

Создает список, содержащий имя функции и аргументы, для обучения модели FastForest с rxEnsemble.

Использование

  fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
    exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
    numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
    trainThreads = 8, randomSeed = NULL, ...)
 

Аргументы

numTrees

Указывает общее число создаваемых в совокупности деревьев принятия решений. Создавая больше деревьев принятия решений, можно расширить покрытие, но время на обучение при этом увеличится. По умолчанию используется значение 100.

numLeaves

Максимальное число листовых узлов (терминальных узлов), которые могут быть созданы в любом дереве. Более высокие значения потенциально увеличивают размер дерева и обеспечивают повышенную точность, но при этом возникает риск лжевзаимосвязи и требуется больше времени на обучение. Значение по умолчанию — 20.

minSplit

Минимальное число обучающих экземпляров, необходимых для формирования листового узла. То есть минимальное число документов, разрешенных на листовом узле дерева регрессии, из данных подвыборки. Часть split означает, что признаки на каждом уровне дерева (узла) распределяются случайным образом. Значение по умолчанию — 10.

exampleFraction

Доля случайно выбранных экземпляров, используемых для каждого дерева. Значение по умолчанию — 0,7.

featureFraction

Доля случайно выбранных признаков, используемых для каждого дерева. Значение по умолчанию — 0,7.

splitFraction

Доля случайно выбранных признаков, используемых для каждого разбиения. Значение по умолчанию — 0,7.

numBins

Максимальное число уникальных значений (интервалов) на признак. Значение по умолчанию — 255.

firstUsePenalty

Признак, который первым использует штрафной коэффициент. Значение по умолчанию — 0.

gainConfLevel

Соответствие дерева требованию к степени надежности (должно находиться в диапазоне [0, 1)). Значение по умолчанию — 0.

trainThreads

Число потоков для использования при обучении. Если указано значение NULL, число используемых потоков определяется внутренне. Значение по умолчанию — NULL.

randomSeed

Задает случайное начальное значение. Значение по умолчанию — NULL.

...

Дополнительные аргументы.