Udostępnij za pośrednictwem


TextCatalog.ProduceWordBags Metoda

Definicja

Przeciążenia

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt , który mapuje wiele kolumn określonych w elemecie WordBagEstimatorinputColumnNames na wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

Parametry

catalog
TransformsCatalog.TextTransforms

Wykaz przekształcenia.

outputColumnName
String

Nazwa kolumny wynikającej z przekształcenia inputColumnNameelementu . Typ danych tej kolumny będzie wektorem o znanym rozmiarze .Single

termSeparator
Char
freqSeparator
Char
inputColumnName
String

Nazwa kolumny do przejęcia danych. Maksymalna liczba n-gramów do przechowywania w słowniku.Separator używany do oddzielania par terminów/częstotliwości.Separator używany do oddzielania terminów od ich częstotliwości. Ten narzędzie do szacowania działa na wektor tekstu.

maximumNgramsCount
Int32

Zwraca

Uwagi

WordBagEstimator różni się od NgramExtractingEstimator tego, że były tokenizuje tekst wewnętrznie, a drugi przyjmuje tokenizowany tekst jako dane wejściowe.

Dotyczy

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parametry

catalog
TransformsCatalog.TextTransforms

Wykaz przekształcenia.

outputColumnName
String

Nazwa kolumny wynikającej z przekształcenia inputColumnNameelementu . Typ danych tej kolumny będzie wektorem o znanym rozmiarze .Single

inputColumnName
String

Nazwa kolumny do przejęcia danych. Ten narzędzie do szacowania działa na wektor tekstu.

ngramLength
Int32

Długość Ngramu.

skipLength
Int32

Maksymalna liczba tokenów do pominięcia podczas konstruowania n-grama.

useAllLengths
Boolean

Czy należy uwzględnić wszystkie długości n-gramowe do ngramLength lub tylko ngramLength.

maximumNgramsCount
Int32

Maksymalna liczba n-gramów do przechowywania w słowniku.

weighting
NgramExtractingEstimator.WeightingCriteria

Miara statystyczna używana do oceny, jak ważne jest słowo do dokumentu w korpusie.

Zwraca

Uwagi

WordBagEstimator różni się od NgramExtractingEstimator tego, że były tokenizuje tekst wewnętrznie, a drugi przyjmuje tokenizowany tekst jako dane wejściowe.

Dotyczy

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt , który mapuje wiele kolumn określonych w elemecie WordBagEstimatorinputColumnNames na wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parametry

catalog
TransformsCatalog.TextTransforms

Wykaz przekształcenia.

outputColumnName
String

Nazwa kolumny wynikającej z przekształcenia inputColumnNameselementu . Typ danych tej kolumny będzie wektorem o znanym rozmiarze .Single

inputColumnNames
String[]

Nazwy wielu kolumn do przejęcia danych. Ten narzędzie do szacowania działa na wektor tekstu.

ngramLength
Int32

Długość Ngramu.

skipLength
Int32

Maksymalna liczba tokenów do pominięcia podczas konstruowania n-grama.

useAllLengths
Boolean

Czy należy uwzględnić wszystkie długości n-gramowe do ngramLength lub tylko ngramLength.

maximumNgramsCount
Int32

Maksymalna liczba n-gramów do przechowywania w słowniku.

weighting
NgramExtractingEstimator.WeightingCriteria

Miara statystyczna używana do oceny, jak ważne jest słowo do dokumentu w korpusie.

Zwraca

Uwagi

WordBagEstimator różni się od NgramExtractingEstimator tego, że były tokenizuje tekst wewnętrznie, a drugi przyjmuje tokenizowany tekst jako dane wejściowe.

Dotyczy