TreeOptions 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
树训练程序的选项。
public abstract class TreeOptions : Microsoft.ML.Trainers.TrainerInputBaseWithGroupId
type TreeOptions = class
inherit TrainerInputBaseWithGroupId
Public MustInherit Class TreeOptions
Inherits TrainerInputBaseWithGroupId
- 继承
- 派生
构造函数
TreeOptions() |
树训练程序的选项。 |
字段
AllowEmptyTrees |
当无法进行根拆分时,允许继续训练。 |
BaggingExampleFraction |
每个包中使用的训练示例百分比。 默认值为 0.7 (70%) 。 |
BaggingSize |
每个包中禁用装袋) 的树数 (0。 |
Bias |
用于计算分类特征的每个特征箱的梯度的偏差。 |
Bundling |
捆绑低填充箱。Bundle.None (0) : no bundleling, Bundle.AggregateLowPopulation (1) : Bundle low population, Bundle.Adjacent (2) : Neighbor low population bundle. |
CategoricalSplit |
是否根据多个分类特征值进行拆分。 |
CompressEnsemble |
压缩树系综。 |
DiskTranspose |
在执行转置时,是否使用磁盘或数据的本机转置设施 () 。 |
EntropyCoefficient |
熵 (正则化) 系数介于 0 和 1 之间。 |
ExampleWeightColumnName |
要用于示例权重的列。 (继承自 TrainerInputBaseWithWeight) |
ExecutionTime |
ML.NET 通道的打印执行时间明细。 |
FeatureColumnName |
要用于特征的列。 (继承自 TrainerInputBase) |
FeatureFirstUsePenalty |
该特征首先使用惩罚系数。 |
FeatureFlocks |
是否在数据集准备期间收集特征以加快训练速度。 |
FeatureFraction |
(随机选择的特征比例,) 每次迭代时使用。 如果只需要 90% 的功能,请使用 0.9。 较低的数字有助于减少过度拟合。 |
FeatureFractionPerSplit |
(随机选择特征的分数,) 每次拆分时使用。 如果值为 0.9,则 90% 的所有功能都将在预期中下降。 |
FeatureReusePenalty |
特征重用惩罚 (正则化) 系数。 |
FeatureSelectionSeed |
活动特征选择的种子。 |
GainConfidenceLevel |
树拟合获得置信度要求。 仅当其可能性与随机选择增益高于此值时,才考虑增益。 |
HistogramPoolSize |
池中的直方图数 (介于 2 和 numLeaves) 之间。 |
LabelColumnName |
用于标签的列。 (继承自 TrainerInputBaseWithLabel) |
MaximumBinCountPerFeature |
每个特征的最大不同值(箱)数。 |
MaximumCategoricalGroupCountPerNode |
对分类特征进行拆分时要考虑的最大分类拆分组数。 拆分组是拆分点的集合。 这用于在存在许多分类特征时减少过度拟合。 |
MaximumCategoricalSplitPointCount |
在分类特征上进行拆分时要考虑的最大分类拆分点。 |
MemoryStatistics |
将内存统计信息打印到 ML.NET 通道。 |
MinimumExampleCountPerLeaf |
形成新树叶所需的最小数据点数。 |
MinimumExampleFractionForCategoricalSplit |
要考虑拆分的箱中的最小分类示例百分比。 默认值为所有训练示例的 0.1%。 |
MinimumExamplesForCategoricalSplit |
要考虑拆分的箱中的最小分类示例计数。 |
NumberOfLeaves |
每个回归树中的最大叶数。 |
NumberOfThreads |
要使用的线程数。 |
NumberOfTrees |
在系综中创建的决策树总数。 |
RowGroupColumnName |
要用于示例 groupId 的列。 (继承自 TrainerInputBaseWithGroupId) |
Seed |
随机数生成器的种子。 |
Smoothing |
用于树正则化的平滑参数。 |
SoftmaxTemperature |
用于选择特征的随机 softmax 分布的温度。 |
SparsifyThreshold |
使用稀疏功能表示形式所需的稀疏级别。 |
TestFrequency |
计算每 k 个轮次的训练/有效/测试的指标值。 |