Microsoft.ML.Transforms.Text Espace de noms
Important
Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.
Espace de noms contenant des composants de transformation de données de texte.
Classes
CustomStopWordsRemovingEstimator |
IEstimator<TTransformer> pour le CustomStopWordsRemovingTransformer. |
CustomStopWordsRemovingEstimator.Options |
Utilisez le remover stop words qui peut supprimer la liste des mots stop spécifiques à la langue (mots les plus courants) déjà définis dans le système. |
CustomStopWordsRemovingTransformer |
ITransformer résultant de l’ajustement d’un CustomStopWordsRemovingEstimator. |
LatentDirichletAllocationEstimator |
La transformation LDA implémente LightLDA, une implémentation de pointe de l’allocation Dirichlet latente. |
LatentDirichletAllocationTransformer |
ITransformer résultant de l’ajustement d’un LatentDirichletAllocationEstimator. |
LatentDirichletAllocationTransformer.ModelParameters |
Fournissez des détails sur les rubriques découvertes par LightLDA. |
NgramExtractingEstimator |
Produit un vecteur de nombres de n-grammes (séquences de mots consécutifs) rencontrés dans le texte d’entrée. |
NgramExtractingTransformer |
ITransformer résultant de l’ajustement d’un NgramExtractingEstimator. |
NgramHashingEstimator | |
NgramHashingTransformer |
Espace de noms contenant des composants de transformation de données de texte. |
StopWordsRemovingEstimator |
IEstimator<TTransformer> pour le CustomStopWordsRemovingTransformer. |
StopWordsRemovingEstimator.Options |
Utilisez le remover de mots vides qui peut supprimer la liste de mots stop spécifiques à la langue (mots les plus courants) déjà défini dans le système. |
StopWordsRemovingTransformer |
ITransformer résultant de l’ajustement d’un StopWordsRemovingEstimator. |
TextFeaturizingEstimator |
Estimateur qui transforme une collection de documents texte en vecteurs de caractéristique numérique. Les vecteurs de caractéristiques sont des nombres normalisés de mots et/ou de caractères n-grammes (en fonction des options fournies). |
TextFeaturizingEstimator.Options |
Options avancées pour le TextFeaturizingEstimator. |
TextNormalizingEstimator |
IEstimator<TTransformer> pour le TextNormalizingTransformer. |
TextNormalizingTransformer |
ITransformer résultant de l’ajustement d’un TextNormalizingEstimator. |
TokenizingByCharactersEstimator |
IEstimator<TTransformer> pour le TokenizingByCharactersTransformer. |
TokenizingByCharactersTransformer |
ITransformer résultant de l’ajustement d’un TokenizingByCharactersEstimator. |
WordBagEstimator |
IEstimator<TTransformer> pour le ITransformer. |
WordBagEstimator.Options |
Options pour l’extraction des n-grammes. |
WordEmbeddingEstimator |
Caractérisation de texte qui convertit les vecteurs de jetons de texte en vecteur numérique à l’aide d’un modèle d’incorporation préentraîné. |
WordEmbeddingTransformer |
ITransformer résultant de l’ajustement d’un WordEmbeddingEstimator. |
WordHashBagEstimator |
IEstimator<TTransformer> pour le ITransformer. |
WordTokenizingEstimator |
Tokenise le texte d’entrée à l’aide de délimiteurs spécifiés. |
WordTokenizingTransformer |
ITransformer résultant de l’ajustement d’un WordTokenizingEstimator. |
Structures
LatentDirichletAllocationTransformer.ModelParameters.ItemScore |
Espace de noms contenant des composants de transformation de données de texte. |
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore |
Espace de noms contenant des composants de transformation de données de texte. |
Interfaces
IStopWordsRemoverOptions |
Définit le type de suppression de mots vides pris en charge. |
Énumérations
NgramExtractingEstimator.WeightingCriteria |
Mesure statistique utilisée pour évaluer l’importance d’un mot dans un corpus. Cette énumération est sérialisée. |
StopWordsRemovingEstimator.Language |
Langue des mots vides. Cette énumération est sérialisée. |
TextFeaturizingEstimator.Language |
Langue du texte. Cette énumération est sérialisée. |
TextFeaturizingEstimator.NormFunction |
Type de normaliseur de vecteur de texte. |
TextNormalizingEstimator.CaseMode |
Mode de normalisation de la casse du texte. Cette énumération est sérialisée. |
WordEmbeddingEstimator.PretrainedModelKind |
Spécifie les incorporations de mots à utiliser. |