Поделиться через


TextCatalog.ProduceWordBags Метод

Определение

Перегрузки

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , inputColumnNames с вектором n-граммов в новом столбце с именем outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

Параметры

catalog
TransformsCatalog.TextTransforms

Каталог преобразования.

outputColumnName
String

Имя столбца, полученного в результате преобразования inputColumnName. Тип данных этого столбца будет иметь известный размер вектора Single.

termSeparator
Char
freqSeparator
Char
inputColumnName
String

Имя столбца для получения данных. Максимальное количество n-граммов для хранения в словаре.Разделитель, используемый для разделения пар терминов и частот.Разделитель используется для разделения терминов от их частоты. Этот оценщик работает над вектором текста.

maximumNgramsCount
Int32

Возвращаемое значение

Комментарии

WordBagEstimator отличается от NgramExtractingEstimator того, что первый маркеризирует текст внутри, а второй принимает маркеризованный текст в качестве входных данных.

Применяется к

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Параметры

catalog
TransformsCatalog.TextTransforms

Каталог преобразования.

outputColumnName
String

Имя столбца, полученного в результате преобразования inputColumnName. Тип данных этого столбца будет иметь известный размер вектора Single.

inputColumnName
String

Имя столбца для получения данных. Этот оценщик работает над вектором текста.

ngramLength
Int32

Длина грамма.

skipLength
Int32

Максимальное количество токенов, пропускаемых при создании N-грамма.

useAllLengths
Boolean

Следует ли включать все n-граммы длиной до ngramLength или только ngramLength.

maximumNgramsCount
Int32

Максимальное количество n-граммов для хранения в словаре.

weighting
NgramExtractingEstimator.WeightingCriteria

Статистическая мера, используемая для оценки того, насколько важно слово для документа в корпусе.

Возвращаемое значение

Комментарии

WordBagEstimator отличается от NgramExtractingEstimator того, что первый маркеризирует текст внутри, а второй принимает маркеризованный текст в качестве входных данных.

Применяется к

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , inputColumnNames с вектором n-граммов в новом столбце с именем outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Параметры

catalog
TransformsCatalog.TextTransforms

Каталог преобразования.

outputColumnName
String

Имя столбца, полученного в результате преобразования inputColumnNames. Тип данных этого столбца будет иметь известный размер вектора Single.

inputColumnNames
String[]

Имена нескольких столбцов для получения данных. Этот оценщик работает над вектором текста.

ngramLength
Int32

Длина грамма.

skipLength
Int32

Максимальное количество токенов, пропускаемых при создании N-грамма.

useAllLengths
Boolean

Следует ли включать все n-граммы длиной до ngramLength или только ngramLength.

maximumNgramsCount
Int32

Максимальное количество n-граммов для хранения в словаре.

weighting
NgramExtractingEstimator.WeightingCriteria

Статистическая мера, используемая для оценки того, насколько важно слово для документа в корпусе.

Возвращаемое значение

Комментарии

WordBagEstimator отличается от NgramExtractingEstimator того, что первый маркеризирует текст внутри, а второй принимает маркеризованный текст в качестве входных данных.

Применяется к