Partager via


Microsoft.ML.Transforms.Text Espace de noms

Espace de noms contenant des composants de transformation de données de texte.

Classes

CustomStopWordsRemovingEstimator

IEstimator<TTransformer> pour le CustomStopWordsRemovingTransformer.

CustomStopWordsRemovingEstimator.Options

Utilisez le remover stop words qui peut supprimer la liste des mots stop spécifiques à la langue (mots les plus courants) déjà définis dans le système.

CustomStopWordsRemovingTransformer

ITransformer résultant de l’ajustement d’un CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

La transformation LDA implémente LightLDA, une implémentation de pointe de l’allocation Dirichlet latente.

LatentDirichletAllocationTransformer

ITransformer résultant de l’ajustement d’un LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

Fournissez des détails sur les rubriques découvertes par LightLDA.

NgramExtractingEstimator

Produit un vecteur de nombres de n-grammes (séquences de mots consécutifs) rencontrés dans le texte d’entrée.

NgramExtractingTransformer

ITransformer résultant de l’ajustement d’un NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer> pour le NgramHashingTransformer.

NgramHashingTransformer

Espace de noms contenant des composants de transformation de données de texte.

StopWordsRemovingEstimator

IEstimator<TTransformer> pour le CustomStopWordsRemovingTransformer.

StopWordsRemovingEstimator.Options

Utilisez le remover de mots vides qui peut supprimer la liste de mots stop spécifiques à la langue (mots les plus courants) déjà défini dans le système.

StopWordsRemovingTransformer

ITransformer résultant de l’ajustement d’un StopWordsRemovingEstimator.

TextFeaturizingEstimator

Estimateur qui transforme une collection de documents texte en vecteurs de caractéristique numérique. Les vecteurs de caractéristiques sont des nombres normalisés de mots et/ou de caractères n-grammes (en fonction des options fournies).

TextFeaturizingEstimator.Options

Options avancées pour le TextFeaturizingEstimator.

TextNormalizingEstimator

IEstimator<TTransformer> pour le TextNormalizingTransformer.

TextNormalizingTransformer

ITransformer résultant de l’ajustement d’un TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer> pour le TokenizingByCharactersTransformer.

TokenizingByCharactersTransformer

ITransformer résultant de l’ajustement d’un TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer> pour le ITransformer.

WordBagEstimator.Options

Options pour l’extraction des n-grammes.

WordEmbeddingEstimator

Caractérisation de texte qui convertit les vecteurs de jetons de texte en vecteur numérique à l’aide d’un modèle d’incorporation préentraîné.

WordEmbeddingTransformer

ITransformer résultant de l’ajustement d’un WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer> pour le ITransformer.

WordTokenizingEstimator

Tokenise le texte d’entrée à l’aide de délimiteurs spécifiés.

WordTokenizingTransformer

ITransformer résultant de l’ajustement d’un WordTokenizingEstimator.

Structures

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Espace de noms contenant des composants de transformation de données de texte.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Espace de noms contenant des composants de transformation de données de texte.

Interfaces

IStopWordsRemoverOptions

Définit le type de suppression de mots vides pris en charge.

Énumérations

NgramExtractingEstimator.WeightingCriteria

Mesure statistique utilisée pour évaluer l’importance d’un mot dans un corpus. Cette énumération est sérialisée.

StopWordsRemovingEstimator.Language

Langue des mots vides. Cette énumération est sérialisée.

TextFeaturizingEstimator.Language

Langue du texte. Cette énumération est sérialisée.

TextFeaturizingEstimator.NormFunction

Type de normaliseur de vecteur de texte.

TextNormalizingEstimator.CaseMode

Mode de normalisation de la casse du texte. Cette énumération est sérialisée.

WordEmbeddingEstimator.PretrainedModelKind

Spécifie les incorporations de mots à utiliser.