microsoftml.count_select:基于计数的特征选择
使用情况
microsoftml.count_select(cols: [list, str], count: int = 1, **kargs)
说明
选择非默认值计数大于或等于阈值的特征。
详细信息
在特征选择转换中使用计数模式时,如果具有某项特征的非默认值的示例数大于或等于指定计数,择选择该特征。 计数模式特征选择转换在与分类哈希转换一起应用时非常有用(另请参阅 categorical_hash
)。 计数特征选择可以删除示例中没有数据的哈希转换生成的那些特征。
参数
cols
指定要选择的字符串或变量名称列表。
计数
基于计数的特征选择的阈值。 当且仅当至少有 count
个示例具有某项特征的非默认值时,才选择该特征。 默认值为 1。
kargs
发送到计算引擎的其他参数。
返回
一个定义转换的对象。