BoostedTreeOptions 类

定义

用于提升树训练程序的选项。

public abstract class BoostedTreeOptions : Microsoft.ML.Trainers.FastTree.TreeOptions
type BoostedTreeOptions = class
    inherit TreeOptions
Public MustInherit Class BoostedTreeOptions
Inherits TreeOptions
继承
派生

构造函数

BoostedTreeOptions()

用于提升树训练程序的选项。

字段

AllowEmptyTrees

当无法进行根拆分时,允许继续训练。

(继承自 TreeOptions)
BaggingExampleFraction

每个包中使用的训练示例百分比。 默认值为 0.7 (70%) 。

(继承自 TreeOptions)
BaggingSize

每个包中禁用装袋) 的树数 (0。

(继承自 TreeOptions)
BestStepRankingRegressionTrees

用于使用最佳回归步骤树的选项。

Bias

用于计算分类特征的每个特征箱的梯度的偏差。

(继承自 TreeOptions)
Bundling

捆绑低填充箱。Bundle.None (0) : no bundleling, Bundle.AggregateLowPopulation (1) : Bundle low population, Bundle.Adjacent (2) : Neighbor low population bundle.

(继承自 TreeOptions)
CategoricalSplit

是否根据多个分类特征值进行拆分。

(继承自 TreeOptions)
CompressEnsemble

压缩树系综。

(继承自 TreeOptions)
DiskTranspose

在执行转置时,是否使用磁盘或数据的本机转置设施 () 。

(继承自 TreeOptions)
DropoutRate

树正则化的辍学率。

EnablePruning

启用训练后树修剪以避免过度拟合。 它需要验证集。

EntropyCoefficient

熵 (正则化) 系数介于 0 和 1 之间。

(继承自 TreeOptions)
ExampleWeightColumnName

要用于示例权重的列。

(继承自 TrainerInputBaseWithWeight)
ExecutionTime

ML.NET 通道的打印执行时间明细。

(继承自 TreeOptions)
FeatureColumnName

要用于特征的列。

(继承自 TrainerInputBase)
FeatureFirstUsePenalty

该特征首先使用惩罚系数。

(继承自 TreeOptions)
FeatureFlocks

是否在数据集准备期间收集特征以加快训练速度。

(继承自 TreeOptions)
FeatureFraction

(随机选择的特征比例,) 每次迭代时使用。 如果只需要 90% 的功能,请使用 0.9。 较低的数字有助于减少过度拟合。

(继承自 TreeOptions)
FeatureFractionPerSplit

(随机选择特征的分数,) 每次拆分时使用。 如果值为 0.9,则 90% 的所有功能都将在预期中下降。

(继承自 TreeOptions)
FeatureReusePenalty

特征重用惩罚 (正则化) 系数。

(继承自 TreeOptions)
FeatureSelectionSeed

活动特征选择的种子。

(继承自 TreeOptions)
FilterZeroLambdas

在训练期间筛选零 lambda。

GainConfidenceLevel

树拟合获得置信度要求。 仅当其可能性与随机选择增益高于此值时,才考虑增益。

(继承自 TreeOptions)
GetDerivativesSampleRate

在 GetDerivatives 函数中对每个查询采样 1(以 k 次为单位)。

HistogramPoolSize

池中的直方图数 (介于 2 和 numLeaves) 之间。

(继承自 TreeOptions)
LabelColumnName

用于标签的列。

(继承自 TrainerInputBaseWithLabel)
LearningRate

学习速率。

MaximumBinCountPerFeature

每个特征的最大不同值(箱)数。

(继承自 TreeOptions)
MaximumCategoricalGroupCountPerNode

对分类特征进行拆分时要考虑的最大分类拆分组数。 拆分组是拆分点的集合。 这用于在存在许多分类特征时减少过度拟合。

(继承自 TreeOptions)
MaximumCategoricalSplitPointCount

在分类特征上进行拆分时要考虑的最大分类拆分点。

(继承自 TreeOptions)
MaximumNumberOfLineSearchSteps

括号后行搜索步骤的数目。

MaximumTreeOutput

单树输出绝对值的上限。

MemoryStatistics

将内存统计信息打印到 ML.NET 通道。

(继承自 TreeOptions)
MinimumExampleCountPerLeaf

形成新树叶所需的最小数据点数。

(继承自 TreeOptions)
MinimumExampleFractionForCategoricalSplit

要考虑拆分的箱中的最小分类示例百分比。 默认值为所有训练示例的 0.1%。

(继承自 TreeOptions)
MinimumExamplesForCategoricalSplit

要考虑拆分的箱中的最小分类示例计数。

(继承自 TreeOptions)
MinimumStepSize

最小行搜索步骤大小。

NumberOfLeaves

每个回归树中的最大叶数。

(继承自 TreeOptions)
NumberOfThreads

要使用的线程数。

(继承自 TreeOptions)
NumberOfTrees

在系综中创建的决策树总数。

(继承自 TreeOptions)
OptimizationAlgorithm

要使用的优化算法。

PruningThreshold

修剪的容错阈值。

PruningWindowSize

用于修剪的移动窗口大小。

RandomStart

训练从 /r1) 确定的随机排序 (开始。

RowGroupColumnName

要用于示例 groupId 的列。

(继承自 TrainerInputBaseWithGroupId)
Seed

随机数生成器的种子。

(继承自 TreeOptions)
Shrinkage

收缩。

Smoothing

用于树正则化的平滑参数。

(继承自 TreeOptions)
SoftmaxTemperature

用于选择特征的随机 softmax 分布的温度。

(继承自 TreeOptions)
SparsifyThreshold

使用稀疏功能表示形式所需的稀疏级别。

(继承自 TreeOptions)
TestFrequency

计算每 k 个轮次的训练/有效/测试的指标值。

(继承自 TreeOptions)
UseLineSearch

确定是否对步长使用行搜索。

UseTolerantPruning

使用窗口和容差进行修剪。

WriteLastEnsemble

编写最后一个系综,而不是由提前停止确定的系综。

属性

EarlyStoppingRule

在满足指定条件后,用于终止训练过程的提前停止规则。 可能的选择是 EarlyStoppingRuleBase的实现,例如 TolerantEarlyStoppingRuleGeneralityLossRule

适用于