CountFeatureSelectingEstimator 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
选择非默认值计数大于或等于阈值的槽。
public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
- 继承
-
CountFeatureSelectingEstimator
- 实现
注解
估算器特征
此估算器是否需要查看数据来训练其参数? | 是 |
输入列数据类型 | 或文本数据类型的SingleDouble向量或标量 |
输出列数据类型 | 与输入列相同 |
可导出到 ONNX | 是 |
此转换使用一组聚合器来计算每个槽 (向量元素的值数,) 非默认和非缺失 (的默认值和缺失 (,请参阅) 中的 DataKind 备注部分。 如果计数值小于提供的 count 参数,则会删除该槽。 当与 a OneHotHashEncodingTransformer一起应用时,此转换非常有用。 它可以删除哈希转换生成的功能,这些特征在示例中没有数据。
例如,如果将 count 参数设置为 3 并适合估算器,请将转换器应用于以下功能列,则会看到第二个槽,其中包含:NaN (缺失值) 、5、5、0 (默认值) 值被丢弃,因为该槽只有两个非默认值和非缺失值,即这两个 5 个值。 正在保留第三个槽,因为它的值为 6、6、6、NaN;因此,它具有 3 个非默认值和非缺失。
功能 |
---|
4,NaN,6 |
4,5,6 |
4,5,6 |
4,0,NaN |
这是上述数据集在转换后的外观。
功能 |
---|
4,6 |
4,6 |
4,6 |
4,NaN |
有关使用示例的链接,请查看“另请参阅”部分。
方法
Fit(IDataView) |
火车并返回一个 ITransformer。 |
GetOutputSchema(SchemaShape) |
返回 SchemaShape 由转换器生成的架构。 用于管道中的架构传播和验证。 |
扩展方法
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
将“缓存检查点”追加到估算器链。 这将确保根据缓存的数据训练下游估算器。 在执行多个数据传递的训练器之前,拥有缓存检查点会很有帮助。 |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
给定估算器后,返回一个包装对象,该对象将调用委托一次 Fit(IDataView) 。 估算器通常必须返回有关适合的内容的信息,这就是为什么 Fit(IDataView) 该方法返回特定类型化对象的原因,而不仅仅是常规 ITransformer对象。 但是,同时, IEstimator<TTransformer> 通常形成为包含许多对象的管道,因此,我们可能需要通过 EstimatorChain<TLastTransformer> 估算器链生成一个估算器链,以便将转换器埋在此链中的某个位置。 对于该方案,我们可以通过此方法附加一个委托,该委托将在调用拟合后调用。 |