HashingEstimator.ColumnOptions Конструктор
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Описывает, как преобразователь обрабатывает одну пару столбцов.
public ColumnOptions (string name, string inputColumnName = default, int numberOfBits = 31, uint seed = 314489979, bool useOrderedHashing = false, int maximumNumberOfInverts = 0, bool combine = false);
new Microsoft.ML.Transforms.HashingEstimator.ColumnOptions : string * string * int * uint32 * bool * int * bool -> Microsoft.ML.Transforms.HashingEstimator.ColumnOptions
Public Sub New (name As String, Optional inputColumnName As String = Nothing, Optional numberOfBits As Integer = 31, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = false, Optional maximumNumberOfInverts As Integer = 0, Optional combine As Boolean = false)
Параметры
- name
- String
Имя столбца, полученного из преобразования inputColumnName
.
- inputColumnName
- String
Имя столбца для преобразования. Если задано null
значение , значение будет name
использоваться в качестве источника.
- numberOfBits
- Int32
Число битов в результирующем хэше. Должно быть от 1 до 31 включительно.
- seed
- UInt32
Начальное значение хэширования.
- useOrderedHashing
- Boolean
Указывает, должна ли позиция каждого термина быть включена в хэш, применяется только к входным данным типа вектора.
- maximumNumberOfInverts
- Int32
Во время хэширования мы создаем сопоставления между исходными значениями и созданными хэш-значениями.
Текстовое представление исходных значений хранится в именах слотов заметок для нового столбца. Хэширование, например, может сопоставлять множество начальных значений с одним.
maximumNumberOfInverts
задает верхнюю границу числа уникальных входных значений, сопоставленных с хэшом, который следует сохранить.
0 не сохраняет входные значения. -1 сохраняет все входные значения, сопоставленные с каждым хэшом.
- combine
- Boolean
Следует ли хэшировать слоты векторного столбца в одно значение.