OneHotEncodingEstimator Класс
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Преобразует один или несколько входных столбцов категориальных значений в столько выходных столбцов одно-горячих векторов.
public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
- Наследование
-
OneHotEncodingEstimator
- Реализации
Комментарии
Характеристики оценщика
Нужно ли этому оценщику просмотреть данные для обучения параметров? | Да |
Тип данных входного столбца | Вектор или скаляр числовых, логических, текстовыхDateTime или ключевых типов. |
Тип данных выходного столбца | Скалярный или вектор ключа или вектор Single типа. |
Экспортируемый в ONNX | Да |
Создает OneHotEncodingEstimator словарь уникальных значений, отображаемых в входном столбце. Результирующий OneHotEncodingTransformer результат преобразует один или несколько входных столбцов в столько выходных столбцов векторов с одним горячим кодированием.
Часто OneHotEncodingEstimator используется для преобразования категориальных данных в форму, которую можно предоставить алгоритму машинного обучения.
Выходные данные этого преобразования задаются в следующих значениях OneHotEncodingEstimator.OutputKind:
Indicator создает вектор индикатора. Каждый слот в этом векторе соответствует категории в словаре, поэтому его длина равна размеру созданного словаря. Если значение не найдено в диктории, выходные данные являются нулевым вектором.
Bag создает один вектор таким образом, чтобы каждый слот сохранял количество экземпляров соответствующего значения во входном векторе. Каждый слот в этом векторе соответствует значению в словаре, поэтому его длина — это размер встроенного словаря. Indicator и Bag отличаются просто тем, как битовые векторы, созданные из отдельных слотов во входном столбце, агрегируются: для индикатора они объединяются и добавляются в контейнер. Если исходный столбец является скалярным, параметры индикатора и контейнера идентичны.
Key создает ключи в столбце KeyDataViewType . Если входной столбец является вектором, выходные данные содержат тип ключа вектории, где каждый слот вектора соответствует соответствующему слоту входного вектора. Если категория не найдена в словаре bulit, оно присваивается нулю значения.
Binary создает двоичный вектор в кодировке для представления значений, найденных в словаре, которые присутствуют в входном столбце. Если значение во входном столбце не найдено в словаре, выходные данные являются нулевым вектором.
OneHotEncodingTransformer можно применить к одному или нескольким столбцам, в этом случае он создает и использует отдельный словарь для каждого столбца, к которому он применяется.
Ознакомьтесь с разделом "См. также" ссылки на примеры использования.
Методы
Fit(IDataView) |
Поезда и возвращается OneHotEncodingTransformer. |
GetOutputSchema(SchemaShape) |
Возвращает схему SchemaShape , которая будет производиться преобразователем. Используется для распространения и проверки схемы в конвейере. |
Методы расширения
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Добавьте "контрольную точку кэширования" в цепочку оценщика. Это обеспечит обучение подчиненных оценщиков на основе кэшированных данных. Рекомендуется создать контрольную точку кэширования перед обучением, которые принимают несколько передач данных. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Учитывая оценщик, возвращает объект-оболочку, который будет вызывать делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что было в форме, поэтому Fit(IDataView) метод возвращает специально типизированный объект, а не просто общий ITransformer. Однако, в то же время, IEstimator<TTransformer> часто формируются в конвейеры со многими объектами, поэтому нам может потребоваться построить цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. В этом сценарии мы можем подключить делегат, который будет вызываться после вызова соответствия. |
Применяется к
См. также раздел
- OneHotEncoding(TransformsCatalog+CategoricalTransforms, String, String, OneHotEncodingEstimator+OutputKind, Int32, ValueToKeyMappingEstimator+KeyOrdinality, IDataView)
- OneHotEncoding(TransformsCatalog+CategoricalTransforms, InputOutputColumnPair[], OneHotEncodingEstimator+OutputKind, Int32, ValueToKeyMappingEstimator+KeyOrdinality, IDataView)