PretrainedTreeFeaturizationEstimator 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
IEstimator<TTransformer>包含预先训练TreeEnsembleModelParameters的 并调用其 Fit(IDataView) 的 基于预先训练的模型生成特征化器。
public sealed class PretrainedTreeFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type PretrainedTreeFeaturizationEstimator = class
inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class PretrainedTreeFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
- 继承
注解
输入和输出列
输入标签列数据必须为Single 。 输入特征列数据必须是 的已知大小向量Single。
此估算器输出以下列:
输出列名称 | 列名称 | 说明 |
---|---|---|
Trees |
向量Single | 所有树的输出值。 |
Leaves |
Single 的向量 | 所有 ID 都会离开输入特征向量所在的位置。 |
Paths |
Single 的向量 | 输入特征向量传递以到达叶的路径。 |
这些输出列都是可选的,用户可以更改其名称。 请将跳过的列的名称设置为 null,以便不会生成它们。
预测详细信息
此估算器从树系综模型生成多个输出列。 假设模型仅包含一个决策树:
Node 0
/ \
/ \
/ \
/ \
Node 1 Node 2
/ \ / \
/ \ / \
/ \ Leaf -3 Node 3
Leaf -1 Leaf -2 / \
/ \
Leaf -4 Leaf -5
假设输入特征向量属于 Leaf -1
。 输出 Trees
可以是 1 元素向量,其中唯一的值是 携带的 Leaf -1
决策值。 输出 Leaves
为 0-1 向量。 如果到达的叶是按 $- (i+1) $ 索引的第$i$ (,则第一个叶) Leaf -1
树中的叶,则 中的 Leaves
第$i$值将为 1,所有其他值为 0。 输出 Paths
是到达叶之前通过的节点的 0-1 表示形式。 中的 Paths
$i$-th 元素指示是否接触按 $i$) 索引的第$i$节点 (。
例如,到达 Leaf -1
潜在顾客 $[1, 1, 0, 0]$ 作为 Paths
。 如果存在多个树,则此估算器只会从所有树中连接 Trees
', Leaves
' , Paths
'' , (第一棵树的信息首先出现在) 串联向量中。
有关使用示例的链接,请查看“另请参阅”部分。
方法
Fit(IDataView) |
生成一个 ,它将调用InputColumnName |
GetOutputSchema(SchemaShape) |
PretrainedTreeFeaturizationEstimator 将三个浮向量列添加到 中 |
扩展方法
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
将“缓存检查点”追加到估算器链。 这将确保针对缓存的数据训练下游估算器。 在接受多个数据传递的训练程序之前设置缓存检查点会很有帮助。 |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
给定估算器后,返回一个包装对象,该对象在调用 后 Fit(IDataView) 将调用委托。 对于估算器来说,返回有关适合对象的信息通常很重要,这就是方法返回特定类型对象(而不仅仅是常规 ITransformer)的原因Fit(IDataView)。 但是,同时, IEstimator<TTransformer> 通常形成为包含许多对象的管道,因此我们可能需要通过 EstimatorChain<TLastTransformer> 构建估算器链,其中要获取转换器的估算器埋在此链中的某个位置。 对于这种情况,我们可以通过此方法附加一个委托,该委托将在调用 fit 后调用。 |