TreeOptions 类

定义

树训练程序的选项。

public abstract class TreeOptions : Microsoft.ML.Trainers.TrainerInputBaseWithGroupId
type TreeOptions = class
    inherit TrainerInputBaseWithGroupId
Public MustInherit Class TreeOptions
Inherits TrainerInputBaseWithGroupId
继承
派生

构造函数

TreeOptions()

树训练程序的选项。

字段

AllowEmptyTrees

当无法进行根拆分时,允许继续训练。

BaggingExampleFraction

每个包中使用的训练示例百分比。 默认值为 0.7 (70%) 。

BaggingSize

每个包中禁用装袋) 的树数 (0。

Bias

用于计算分类特征的每个特征箱的梯度的偏差。

Bundling

捆绑低填充箱。Bundle.None (0) : no bundleling, Bundle.AggregateLowPopulation (1) : Bundle low population, Bundle.Adjacent (2) : Neighbor low population bundle.

CategoricalSplit

是否根据多个分类特征值进行拆分。

CompressEnsemble

压缩树系综。

DiskTranspose

在执行转置时,是否使用磁盘或数据的本机转置设施 () 。

EntropyCoefficient

熵 (正则化) 系数介于 0 和 1 之间。

ExampleWeightColumnName

要用于示例权重的列。

(继承自 TrainerInputBaseWithWeight)
ExecutionTime

ML.NET 通道的打印执行时间明细。

FeatureColumnName

要用于特征的列。

(继承自 TrainerInputBase)
FeatureFirstUsePenalty

该特征首先使用惩罚系数。

FeatureFlocks

是否在数据集准备期间收集特征以加快训练速度。

FeatureFraction

(随机选择的特征比例,) 每次迭代时使用。 如果只需要 90% 的功能,请使用 0.9。 较低的数字有助于减少过度拟合。

FeatureFractionPerSplit

(随机选择特征的分数,) 每次拆分时使用。 如果值为 0.9,则 90% 的所有功能都将在预期中下降。

FeatureReusePenalty

特征重用惩罚 (正则化) 系数。

FeatureSelectionSeed

活动特征选择的种子。

GainConfidenceLevel

树拟合获得置信度要求。 仅当其可能性与随机选择增益高于此值时,才考虑增益。

HistogramPoolSize

池中的直方图数 (介于 2 和 numLeaves) 之间。

LabelColumnName

用于标签的列。

(继承自 TrainerInputBaseWithLabel)
MaximumBinCountPerFeature

每个特征的最大不同值(箱)数。

MaximumCategoricalGroupCountPerNode

对分类特征进行拆分时要考虑的最大分类拆分组数。 拆分组是拆分点的集合。 这用于在存在许多分类特征时减少过度拟合。

MaximumCategoricalSplitPointCount

在分类特征上进行拆分时要考虑的最大分类拆分点。

MemoryStatistics

将内存统计信息打印到 ML.NET 通道。

MinimumExampleCountPerLeaf

形成新树叶所需的最小数据点数。

MinimumExampleFractionForCategoricalSplit

要考虑拆分的箱中的最小分类示例百分比。 默认值为所有训练示例的 0.1%。

MinimumExamplesForCategoricalSplit

要考虑拆分的箱中的最小分类示例计数。

NumberOfLeaves

每个回归树中的最大叶数。

NumberOfThreads

要使用的线程数。

NumberOfTrees

在系综中创建的决策树总数。

RowGroupColumnName

要用于示例 groupId 的列。

(继承自 TrainerInputBaseWithGroupId)
Seed

随机数生成器的种子。

Smoothing

用于树正则化的平滑参数。

SoftmaxTemperature

用于选择特征的随机 softmax 分布的温度。

SparsifyThreshold

使用稀疏功能表示形式所需的稀疏级别。

TestFrequency

计算每 k 个轮次的训练/有效/测试的指标值。

适用于