BoostedTreeOptions 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
用于提升树训练程序的选项。
public abstract class BoostedTreeOptions : Microsoft.ML.Trainers.FastTree.TreeOptions
type BoostedTreeOptions = class
inherit TreeOptions
Public MustInherit Class BoostedTreeOptions
Inherits TreeOptions
- 继承
- 派生
构造函数
BoostedTreeOptions() |
用于提升树训练程序的选项。 |
字段
AllowEmptyTrees |
当无法进行根拆分时,允许继续训练。 (继承自 TreeOptions) |
BaggingExampleFraction |
每个包中使用的训练示例百分比。 默认值为 0.7 (70%) 。 (继承自 TreeOptions) |
BaggingSize |
每个包中禁用装袋) 的树数 (0。 (继承自 TreeOptions) |
BestStepRankingRegressionTrees |
用于使用最佳回归步骤树的选项。 |
Bias |
用于计算分类特征的每个特征箱的梯度的偏差。 (继承自 TreeOptions) |
Bundling |
捆绑低填充箱。Bundle.None (0) : no bundleling, Bundle.AggregateLowPopulation (1) : Bundle low population, Bundle.Adjacent (2) : Neighbor low population bundle. (继承自 TreeOptions) |
CategoricalSplit |
是否根据多个分类特征值进行拆分。 (继承自 TreeOptions) |
CompressEnsemble |
压缩树系综。 (继承自 TreeOptions) |
DiskTranspose |
在执行转置时,是否使用磁盘或数据的本机转置设施 () 。 (继承自 TreeOptions) |
DropoutRate |
树正则化的辍学率。 |
EnablePruning |
启用训练后树修剪以避免过度拟合。 它需要验证集。 |
EntropyCoefficient |
熵 (正则化) 系数介于 0 和 1 之间。 (继承自 TreeOptions) |
ExampleWeightColumnName |
要用于示例权重的列。 (继承自 TrainerInputBaseWithWeight) |
ExecutionTime |
ML.NET 通道的打印执行时间明细。 (继承自 TreeOptions) |
FeatureColumnName |
要用于特征的列。 (继承自 TrainerInputBase) |
FeatureFirstUsePenalty |
该特征首先使用惩罚系数。 (继承自 TreeOptions) |
FeatureFlocks |
是否在数据集准备期间收集特征以加快训练速度。 (继承自 TreeOptions) |
FeatureFraction |
(随机选择的特征比例,) 每次迭代时使用。 如果只需要 90% 的功能,请使用 0.9。 较低的数字有助于减少过度拟合。 (继承自 TreeOptions) |
FeatureFractionPerSplit |
(随机选择特征的分数,) 每次拆分时使用。 如果值为 0.9,则 90% 的所有功能都将在预期中下降。 (继承自 TreeOptions) |
FeatureReusePenalty |
特征重用惩罚 (正则化) 系数。 (继承自 TreeOptions) |
FeatureSelectionSeed |
活动特征选择的种子。 (继承自 TreeOptions) |
FilterZeroLambdas |
在训练期间筛选零 lambda。 |
GainConfidenceLevel |
树拟合获得置信度要求。 仅当其可能性与随机选择增益高于此值时,才考虑增益。 (继承自 TreeOptions) |
GetDerivativesSampleRate |
在 GetDerivatives 函数中对每个查询采样 1(以 k 次为单位)。 |
HistogramPoolSize |
池中的直方图数 (介于 2 和 numLeaves) 之间。 (继承自 TreeOptions) |
LabelColumnName |
用于标签的列。 (继承自 TrainerInputBaseWithLabel) |
LearningRate |
学习速率。 |
MaximumBinCountPerFeature |
每个特征的最大不同值(箱)数。 (继承自 TreeOptions) |
MaximumCategoricalGroupCountPerNode |
对分类特征进行拆分时要考虑的最大分类拆分组数。 拆分组是拆分点的集合。 这用于在存在许多分类特征时减少过度拟合。 (继承自 TreeOptions) |
MaximumCategoricalSplitPointCount |
在分类特征上进行拆分时要考虑的最大分类拆分点。 (继承自 TreeOptions) |
MaximumNumberOfLineSearchSteps |
括号后行搜索步骤的数目。 |
MaximumTreeOutput |
单树输出绝对值的上限。 |
MemoryStatistics |
将内存统计信息打印到 ML.NET 通道。 (继承自 TreeOptions) |
MinimumExampleCountPerLeaf |
形成新树叶所需的最小数据点数。 (继承自 TreeOptions) |
MinimumExampleFractionForCategoricalSplit |
要考虑拆分的箱中的最小分类示例百分比。 默认值为所有训练示例的 0.1%。 (继承自 TreeOptions) |
MinimumExamplesForCategoricalSplit |
要考虑拆分的箱中的最小分类示例计数。 (继承自 TreeOptions) |
MinimumStepSize |
最小行搜索步骤大小。 |
NumberOfLeaves |
每个回归树中的最大叶数。 (继承自 TreeOptions) |
NumberOfThreads |
要使用的线程数。 (继承自 TreeOptions) |
NumberOfTrees |
在系综中创建的决策树总数。 (继承自 TreeOptions) |
OptimizationAlgorithm |
要使用的优化算法。 |
PruningThreshold |
修剪的容错阈值。 |
PruningWindowSize |
用于修剪的移动窗口大小。 |
RandomStart |
训练从 /r1) 确定的随机排序 (开始。 |
RowGroupColumnName |
要用于示例 groupId 的列。 (继承自 TrainerInputBaseWithGroupId) |
Seed |
随机数生成器的种子。 (继承自 TreeOptions) |
Shrinkage |
收缩。 |
Smoothing |
用于树正则化的平滑参数。 (继承自 TreeOptions) |
SoftmaxTemperature |
用于选择特征的随机 softmax 分布的温度。 (继承自 TreeOptions) |
SparsifyThreshold |
使用稀疏功能表示形式所需的稀疏级别。 (继承自 TreeOptions) |
TestFrequency |
计算每 k 个轮次的训练/有效/测试的指标值。 (继承自 TreeOptions) |
UseLineSearch |
确定是否对步长使用行搜索。 |
UseTolerantPruning |
使用窗口和容差进行修剪。 |
WriteLastEnsemble |
编写最后一个系综,而不是由提前停止确定的系综。 |
属性
EarlyStoppingRule |
在满足指定条件后,用于终止训练过程的提前停止规则。 可能的选择是 EarlyStoppingRuleBase的实现,例如 TolerantEarlyStoppingRule 和 GeneralityLossRule。 |