TextCatalog.ProduceWordBags Метод
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Перегрузки
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName
с вектором n-граммов в новом столбце с именем outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Параметры
- catalog
- TransformsCatalog.TextTransforms
Каталог преобразования.
- outputColumnName
- String
Имя столбца, полученного в результате преобразования inputColumnName
.
Тип данных этого столбца будет иметь известный размер вектора Single.
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Имя столбца для получения данных. Максимальное количество n-граммов для хранения в словаре.Разделитель, используемый для разделения пар терминов и частот.Разделитель используется для разделения терминов от их частоты. Этот оценщик работает над вектором текста.
- maximumNgramsCount
- Int32
Возвращаемое значение
Комментарии
WordBagEstimator отличается от NgramExtractingEstimator того, что первый маркеризирует текст внутри, а второй принимает маркеризованный текст в качестве входных данных.
Применяется к
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName
с вектором n-граммов в новом столбце с именем outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Параметры
- catalog
- TransformsCatalog.TextTransforms
Каталог преобразования.
- outputColumnName
- String
Имя столбца, полученного в результате преобразования inputColumnName
.
Тип данных этого столбца будет иметь известный размер вектора Single.
- inputColumnName
- String
Имя столбца для получения данных. Этот оценщик работает над вектором текста.
- ngramLength
- Int32
Длина грамма.
- skipLength
- Int32
Максимальное количество токенов, пропускаемых при создании N-грамма.
- useAllLengths
- Boolean
Следует ли включать все n-граммы длиной до ngramLength
или только ngramLength
.
- maximumNgramsCount
- Int32
Максимальное количество n-граммов для хранения в словаре.
Статистическая мера, используемая для оценки того, насколько важно слово для документа в корпусе.
Возвращаемое значение
Комментарии
WordBagEstimator отличается от NgramExtractingEstimator того, что первый маркеризирует текст внутри, а второй принимает маркеризованный текст в качестве входных данных.
Применяется к
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , inputColumnNames
с вектором n-граммов в новом столбце с именем outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Параметры
- catalog
- TransformsCatalog.TextTransforms
Каталог преобразования.
- outputColumnName
- String
Имя столбца, полученного в результате преобразования inputColumnNames
.
Тип данных этого столбца будет иметь известный размер вектора Single.
- inputColumnNames
- String[]
Имена нескольких столбцов для получения данных. Этот оценщик работает над вектором текста.
- ngramLength
- Int32
Длина грамма.
- skipLength
- Int32
Максимальное количество токенов, пропускаемых при создании N-грамма.
- useAllLengths
- Boolean
Следует ли включать все n-граммы длиной до ngramLength
или только ngramLength
.
- maximumNgramsCount
- Int32
Максимальное количество n-граммов для хранения в словаре.
Статистическая мера, используемая для оценки того, насколько важно слово для документа в корпусе.
Возвращаемое значение
Комментарии
WordBagEstimator отличается от NgramExtractingEstimator того, что первый маркеризирует текст внутри, а второй принимает маркеризованный текст в качестве входных данных.