TextCatalog.ProduceHashedWordBags Méthode
Définition
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Surcharges
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32) |
Créez un WordHashBagEstimator, qui mappe les colonnes multiples spécifiées dans |
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32) |
Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans |
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)
Créez un WordHashBagEstimator, qui mappe les colonnes multiples spécifiées dans inputColumnNames
un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator
Paramètres
- catalog
- TransformsCatalog.TextTransforms
Catalogue de la transformation.
- outputColumnName
- String
Nom de la colonne résultant de la transformation de inputColumnNames
.
Le type de données de cette colonne sera un vecteur de taille connue de Single.
- inputColumnNames
- String[]
Noms des plusieurs colonnes à partir des données. Cet estimateur opère sur le vecteur de texte.
- numberOfBits
- Int32
Nombre de bits à hacher. Doit être compris entre 1 et 30 (inclus).
- ngramLength
- Int32
Longueur du Ngram.
- skipLength
- Int32
Nombre maximal de jetons à ignorer lors de la construction d’un n-grammes.
- useAllLengths
- Boolean
Indique s’il faut inclure toutes les longueurs n-grammes jusqu’à ngramLength
ou seulement ngramLength
.
- seed
- UInt32
Seed de hachage.
- useOrderedHashing
- Boolean
Indique si la position de chaque colonne source doit être incluse dans le hachage (s'il existe plusieurs colonnes sources).
- maximumNumberOfInverts
- Int32
Lors du hachage, nous construisons des mappages entre les valeurs d’origine et les valeurs de hachage produites.
La représentation textuelle des valeurs d’origine est stockée dans les noms d’emplacements des annotations pour la nouvelle colonne. Le hachage, par conséquent, peut mapper de nombreuses valeurs initiales à une.
maximumNumberOfInverts
spécifie la limite supérieure du nombre de valeurs d’entrée distinctes mappées à un hachage qui doit être conservé.
0 ne conserve aucune valeur d’entrée. -1 conserve tous les mappages de valeurs d’entrée à chaque hachage.
Retours
Remarques
WordHashBagEstimator est différent de NgramHashingEstimator celui dans lequel l’ancien tokenise le texte en interne et celui-ci prend du texte tokenisé comme entrée.
S’applique à
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)
Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans inputColumnName
un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator
Paramètres
- catalog
- TransformsCatalog.TextTransforms
Catalogue de la transformation.
- outputColumnName
- String
Nom de la colonne résultant de la transformation de inputColumnName
.
Le type de données de cette colonne sera un vecteur de taille connue de Single.
- inputColumnName
- String
Nom de la colonne à partir duquel extraire les données. Cet estimateur opère sur le vecteur de texte.
- numberOfBits
- Int32
Nombre de bits à hacher. Doit être compris entre 1 et 30 (inclus).
- ngramLength
- Int32
Longueur du Ngram.
- skipLength
- Int32
Nombre maximal de jetons à ignorer lors de la construction d’un n-grammes.
- useAllLengths
- Boolean
Indique s’il faut inclure toutes les longueurs n-grammes jusqu’à ngramLength
ou seulement ngramLength
.
- seed
- UInt32
Seed de hachage.
- useOrderedHashing
- Boolean
Indique si la position de chaque colonne source doit être incluse dans le hachage (s'il existe plusieurs colonnes sources).
- maximumNumberOfInverts
- Int32
Lors du hachage, nous construisons des mappages entre les valeurs d’origine et les valeurs de hachage produites.
La représentation textuelle des valeurs d’origine est stockée dans les noms d’emplacements des annotations pour la nouvelle colonne. Le hachage, par conséquent, peut mapper de nombreuses valeurs initiales à une.
maximumNumberOfInverts
spécifie la limite supérieure du nombre de valeurs d’entrée distinctes mappées à un hachage qui doit être conservé.
0 ne conserve aucune valeur d’entrée. -1 conserve tous les mappages de valeurs d’entrée à chaque hachage.
Retours
Remarques
WordHashBagEstimator est différent de NgramHashingEstimator celui dans lequel l’ancien tokenise le texte en interne et celui-ci prend du texte tokenisé comme entrée.