Поделиться через


StopWordsRemovingEstimator Класс

Определение

public sealed class StopWordsRemovingEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.Text.StopWordsRemovingTransformer>
type StopWordsRemovingEstimator = class
    inherit TrivialEstimator<StopWordsRemovingTransformer>
Public NotInheritable Class StopWordsRemovingEstimator
Inherits TrivialEstimator(Of StopWordsRemovingTransformer)
Наследование

Комментарии

Характеристики оценщика

Нужно ли этому оценщику просмотреть данные для обучения параметров? Нет
Тип данных входного столбца Вектор текста
Тип данных выходного столбца Вектор переменного размера текста
Экспортируемый в ONNX Да

В результате StopWordsRemovingTransformer создается новый столбец с именем, указанным в параметре имени выходного столбца, и заполняется вектором слов, содержащих все слова во входном столбце *** за исключением предопределенного списка стоп-слов для указанного языка. Все сравнения текста, сделанные путем приведения предопределенного текста и текста из входного столбца в нижний регистр с использованием правил регистра инвариантных языков и региональных параметров.

Ознакомьтесь с разделом "См. также" ссылки на примеры использования.

Методы

Fit(IDataView)

IEstimator<TTransformer>для .CustomStopWordsRemovingTransformer

(Унаследовано от TrivialEstimator<TTransformer>)
GetOutputSchema(SchemaShape)

Возвращает схему SchemaShape , которая будет производиться преобразователем. Используется для распространения и проверки схемы в конвейере.

Методы расширения

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Добавьте "контрольную точку кэширования" в цепочку оценщика. Это обеспечит обучение подчиненных оценщиков на основе кэшированных данных. Рекомендуется создать контрольную точку кэширования перед обучением, которые принимают несколько передач данных.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Учитывая оценщик, возвращает объект-оболочку, который будет вызывать делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что было в форме, поэтому Fit(IDataView) метод возвращает специально типизированный объект, а не просто общий ITransformer. Однако, в то же время, IEstimator<TTransformer> часто формируются в конвейеры со многими объектами, поэтому нам может потребоваться построить цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. В этом сценарии мы можем подключить делегат, который будет вызываться после вызова соответствия.

Применяется к

См. также раздел