TextCatalog.ProduceWordBags Méthode
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Surcharges
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Créez un WordBagEstimator, qui mappe la colonne spécifiée dans |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Créez un WordBagEstimator, qui mappe la colonne spécifiée dans |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName
à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Paramètres
- catalog
- TransformsCatalog.TextTransforms
Catalogue de la transformation.
- outputColumnName
- String
Nom de la colonne résultant de la transformation de inputColumnName
.
Le type de données de cette colonne sera le vecteur de taille connue de Single.
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Nom de la colonne à partir de laquelle prendre les données. Nombre maximal de n grammes à stocker dans le dictionnaire.Séparateur utilisé pour séparer les paires termes/fréquences.Séparateur utilisé pour séparer les termes de leur fréquence. Cet estimateur fonctionne sur un vecteur de texte.
- maximumNgramsCount
- Int32
Retours
Remarques
WordBagEstimator est différent de NgramExtractingEstimator par le fait que le premier tokenize le texte en interne et que le second prend du texte tokenisé comme entrée.
S’applique à
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName
à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Paramètres
- catalog
- TransformsCatalog.TextTransforms
Catalogue de la transformation.
- outputColumnName
- String
Nom de la colonne résultant de la transformation de inputColumnName
.
Le type de données de cette colonne sera le vecteur de taille connue de Single.
- inputColumnName
- String
Nom de la colonne à partir de laquelle prendre les données. Cet estimateur fonctionne sur un vecteur de texte.
- ngramLength
- Int32
Longueur du Ngramme.
- skipLength
- Int32
Nombre maximal de jetons à ignorer lors de la construction d’un n-gramme.
- useAllLengths
- Boolean
Indique s’il faut inclure toutes les longueurs de n grammes jusqu’à ngramLength
ou uniquement ngramLength
.
- maximumNgramsCount
- Int32
Nombre maximal de n grammes à stocker dans le dictionnaire.
Mesure statistique utilisée pour évaluer l’importance d’un mot pour un document dans un corpus.
Retours
Remarques
WordBagEstimator est différent de NgramExtractingEstimator par le fait que le premier tokenize le texte en interne et que le second prend du texte tokenisé comme entrée.
S’applique à
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à inputColumnNames
un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Paramètres
- catalog
- TransformsCatalog.TextTransforms
Catalogue de la transformation.
- outputColumnName
- String
Nom de la colonne résultant de la transformation de inputColumnNames
.
Le type de données de cette colonne sera le vecteur de taille connue de Single.
- inputColumnNames
- String[]
Noms des plusieurs colonnes à partir de laquelle extraire les données. Cet estimateur fonctionne sur un vecteur de texte.
- ngramLength
- Int32
Longueur du Ngramme.
- skipLength
- Int32
Nombre maximal de jetons à ignorer lors de la construction d’un n-gramme.
- useAllLengths
- Boolean
Indique s’il faut inclure toutes les longueurs de n grammes jusqu’à ngramLength
ou uniquement ngramLength
.
- maximumNgramsCount
- Int32
Nombre maximal de n grammes à stocker dans le dictionnaire.
Mesure statistique utilisée pour évaluer l’importance d’un mot pour un document dans un corpus.
Retours
Remarques
WordBagEstimator est différent de NgramExtractingEstimator par le fait que le premier tokenize le texte en interne et que le second prend du texte tokenisé comme entrée.