TextCatalog.ProduceWordBags Metoda
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Przeciążenia
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Utwórz obiekt , który mapuje wiele kolumn określonych w elemecie WordBagEstimator |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName
wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Parametry
- catalog
- TransformsCatalog.TextTransforms
Wykaz przekształcenia.
- outputColumnName
- String
Nazwa kolumny wynikającej z przekształcenia inputColumnName
elementu .
Typ danych tej kolumny będzie wektorem o znanym rozmiarze .Single
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Nazwa kolumny do przejęcia danych. Maksymalna liczba n-gramów do przechowywania w słowniku.Separator używany do oddzielania par terminów/częstotliwości.Separator używany do oddzielania terminów od ich częstotliwości. Ten narzędzie do szacowania działa na wektor tekstu.
- maximumNgramsCount
- Int32
Zwraca
Uwagi
WordBagEstimator różni się od NgramExtractingEstimator tego, że były tokenizuje tekst wewnętrznie, a drugi przyjmuje tokenizowany tekst jako dane wejściowe.
Dotyczy
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName
wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parametry
- catalog
- TransformsCatalog.TextTransforms
Wykaz przekształcenia.
- outputColumnName
- String
Nazwa kolumny wynikającej z przekształcenia inputColumnName
elementu .
Typ danych tej kolumny będzie wektorem o znanym rozmiarze .Single
- inputColumnName
- String
Nazwa kolumny do przejęcia danych. Ten narzędzie do szacowania działa na wektor tekstu.
- ngramLength
- Int32
Długość Ngramu.
- skipLength
- Int32
Maksymalna liczba tokenów do pominięcia podczas konstruowania n-grama.
- useAllLengths
- Boolean
Czy należy uwzględnić wszystkie długości n-gramowe do ngramLength
lub tylko ngramLength
.
- maximumNgramsCount
- Int32
Maksymalna liczba n-gramów do przechowywania w słowniku.
Miara statystyczna używana do oceny, jak ważne jest słowo do dokumentu w korpusie.
Zwraca
Uwagi
WordBagEstimator różni się od NgramExtractingEstimator tego, że były tokenizuje tekst wewnętrznie, a drugi przyjmuje tokenizowany tekst jako dane wejściowe.
Dotyczy
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Utwórz obiekt , który mapuje wiele kolumn określonych w elemecie WordBagEstimatorinputColumnNames
na wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parametry
- catalog
- TransformsCatalog.TextTransforms
Wykaz przekształcenia.
- outputColumnName
- String
Nazwa kolumny wynikającej z przekształcenia inputColumnNames
elementu .
Typ danych tej kolumny będzie wektorem o znanym rozmiarze .Single
- inputColumnNames
- String[]
Nazwy wielu kolumn do przejęcia danych. Ten narzędzie do szacowania działa na wektor tekstu.
- ngramLength
- Int32
Długość Ngramu.
- skipLength
- Int32
Maksymalna liczba tokenów do pominięcia podczas konstruowania n-grama.
- useAllLengths
- Boolean
Czy należy uwzględnić wszystkie długości n-gramowe do ngramLength
lub tylko ngramLength
.
- maximumNgramsCount
- Int32
Maksymalna liczba n-gramów do przechowywania w słowniku.
Miara statystyczna używana do oceny, jak ważne jest słowo do dokumentu w korpusie.
Zwraca
Uwagi
WordBagEstimator różni się od NgramExtractingEstimator tego, że były tokenizuje tekst wewnętrznie, a drugi przyjmuje tokenizowany tekst jako dane wejściowe.