microsoftml.count_select:基于计数的特征选择

使用情况

microsoftml.count_select(cols: [list, str], count: int = 1, **kargs)

说明

选择非默认值计数大于或等于阈值的特征。

详细信息

在特征选择转换中使用计数模式时,如果具有某项特征的非默认值的示例数大于或等于指定计数,择选择该特征。 计数模式特征选择转换在与分类哈希转换一起应用时非常有用(另请参阅 categorical_hash)。 计数特征选择可以删除示例中没有数据的哈希转换生成的那些特征。

参数

cols

指定要选择的字符串或变量名称列表。

计数

基于计数的特征选择的阈值。 当且仅当至少有 count 个示例具有某项特征的非默认值时,才选择该特征。 默认值为 1。

kargs

发送到计算引擎的其他参数。

返回

一个定义转换的对象。

请参阅

mutualinformation_select