HashingEstimator.ColumnOptions 构造函数
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
描述转换器如何处理一列对。
public ColumnOptions (string name, string inputColumnName = default, int numberOfBits = 31, uint seed = 314489979, bool useOrderedHashing = false, int maximumNumberOfInverts = 0, bool combine = false);
new Microsoft.ML.Transforms.HashingEstimator.ColumnOptions : string * string * int * uint32 * bool * int * bool -> Microsoft.ML.Transforms.HashingEstimator.ColumnOptions
Public Sub New (name As String, Optional inputColumnName As String = Nothing, Optional numberOfBits As Integer = 31, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = false, Optional maximumNumberOfInverts As Integer = 0, Optional combine As Boolean = false)
参数
- name
- String
由转换 inputColumnName
生成的列的名称。
- inputColumnName
- String
要转换的列的名称。 If set to null
, the value of the name
will be used as source.
- numberOfBits
- Int32
要哈希到的位数。 必须介于 1 和 31 之间(含)。
- seed
- UInt32
哈希种子。
- useOrderedHashing
- Boolean
是否应将每个术语的位置包含在哈希中,仅适用于矢量类型的输入。
- maximumNumberOfInverts
- Int32
在哈希处理期间,我们在原始值和生成的哈希值之间构造映射。
原始值的文本表示形式存储在新列的批注的槽名称中。因此,哈希可以将许多初始值映射到一个值。
maximumNumberOfInverts
指定映射到应保留的哈希的非重复输入值数的上限。
0 不保留任何输入值。 -1 保留映射到每个哈希的所有输入值。
- combine
- Boolean
是否应将向量列的槽哈希处理为单个值。