FastForestBinaryTrainer 类

定义

用于 IEstimator<TTransformer> 使用快速林训练决策树二元分类模型。

public sealed class FastForestBinaryTrainer : Microsoft.ML.Trainers.FastTree.RandomForestTrainerBase<Microsoft.ML.Trainers.FastTree.FastForestBinaryTrainer.Options,Microsoft.ML.Data.BinaryPredictionTransformer<Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>,Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>
type FastForestBinaryTrainer = class
    inherit RandomForestTrainerBase<FastForestBinaryTrainer.Options, BinaryPredictionTransformer<FastForestBinaryModelParameters>, FastForestBinaryModelParameters>
Public NotInheritable Class FastForestBinaryTrainer
Inherits RandomForestTrainerBase(Of FastForestBinaryTrainer.Options, BinaryPredictionTransformer(Of FastForestBinaryModelParameters), FastForestBinaryModelParameters)
继承

注解

若要创建此训练程序,请使用 FastForestFastForest (选项)

输入和输出列

输入标签列数据必须为 Boolean。 输入特征列数据必须是已知大小的向量 Single

该训练程序输出以下列:

输出列名称 列名称 说明
Score Single 模型计算的未绑定分数。
PredictedLabel Boolean 预测的标签,基于分数符号。 负分数映射到 false,正分数映射到 true
Probability Single 通过校准具有 true 作为标签的分数来计算的概率。 概率值在 [0, 1] 范围内。

训练器特征

机器学习任务 二元分类
规范化是否需要?
是否需要缓存?
除 Microsoft.ML 外所需的 NuGet Microsoft.ML.FastTree
可导出到 ONNX

训练算法详细信息

决策树是对输入执行一系列简单测试的非参数模型。 此决策过程将决策树映射到训练数据集中的输出,这些数据集的输入与正在处理的实例类似。 基于相似性度量值在二叉树数据结构的每个节点处做出决策,该度量值通过树的分支以递归方式映射每个实例,直到到达适当的叶节点并返回输出决策。

决策树具有若干优势:

  • 在训练和预测期间的计算和内存使用效率都很高。
  • 它们可以表示非线性决策边界。
  • 可执行集成的特征选择和分类。
  • 可以抵抗干扰特征的影响。

快速林是随机林实现。 该模型由决策树的系综构成。 决策林中的每棵树都通过预测输出高斯分布。 聚合是通过树的集成执行的,用于查找与模型中所有树的组合分布最接近的高斯分布。 此决策林分类器由决策树的系综构成。

一般说来,系综模型可以提供比单个决策树更大的覆盖范围和更高的准确度。 决策林中的每棵树均输出一个高斯分布。

有关详细信息,请参阅:

有关用法示例的链接,请查看“另请参阅”部分。

字段

FeatureColumn

训练程序期望的功能列。

(继承自 TrainerEstimatorBase<TTransformer,TModel>)
GroupIdColumn

排名训练器期望的可选 groupID 列。

(继承自 TrainerEstimatorBaseWithGroupId<TTransformer,TModel>)
LabelColumn

训练程序期望的标签列。 可以是 null,指示标签不用于训练。

(继承自 TrainerEstimatorBase<TTransformer,TModel>)
WeightColumn

训练器期望的权重列。 可以 null,这表示权重不用于训练。

(继承自 TrainerEstimatorBase<TTransformer,TModel>)

属性

Info

用于 IEstimator<TTransformer> 使用快速林训练决策树二元分类模型。

(继承自 FastTreeTrainerBase<TOptions,TTransformer,TModel>)

方法

Fit(IDataView, IDataView)

使用训练和验证数据训练一个 FastForestBinaryTrainer 返回 a BinaryPredictionTransformer<TModel>.

Fit(IDataView)

火车并返回一个 ITransformer

(继承自 TrainerEstimatorBase<TTransformer,TModel>)
GetOutputSchema(SchemaShape)

用于 IEstimator<TTransformer> 使用快速林训练决策树二元分类模型。

(继承自 TrainerEstimatorBase<TTransformer,TModel>)

扩展方法

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

将“缓存检查点”追加到估算器链。 这将确保针对缓存的数据训练下游估算器。 在执行多个数据传递的训练器之前,拥有缓存检查点会很有帮助。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

给定估算器后,返回将调用委托的 Fit(IDataView) 包装对象。 估算器通常必须返回有关拟合情况的信息,这就是为什么 Fit(IDataView) 该方法返回特定类型化对象的原因,而不仅仅是常规 ITransformer对象。 但是,同时, IEstimator<TTransformer> 通常形成为包含许多对象的管道,因此,我们可能需要通过 EstimatorChain<TLastTransformer> 估算器链生成一系列估算器,以便我们要获取转换器的估算器被埋在此链中的某个位置。 对于这种情况,我们可以通过此方法附加调用一次将调用的委托。

适用于

另请参阅