Microsoft.ML.Transforms.Text Espace de noms

Référence

Important

Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.

Espace de noms contenant des composants de transformation de données de texte.

Classes

CustomStopWordsRemovingEstimator	IEstimator<TTransformer> pour le CustomStopWordsRemovingTransformer.
CustomStopWordsRemovingEstimator.Options	Utilisez le remover stop words qui peut supprimer la liste des mots stop spécifiques à la langue (mots les plus courants) déjà définis dans le système.
CustomStopWordsRemovingTransformer	ITransformer résultant de l’ajustement d’un CustomStopWordsRemovingEstimator.
LatentDirichletAllocationEstimator	La transformation LDA implémente LightLDA, une implémentation de pointe de l’allocation Dirichlet latente.
LatentDirichletAllocationTransformer	ITransformer résultant de l’ajustement d’un LatentDirichletAllocationEstimator.
LatentDirichletAllocationTransformer.ModelParameters	Fournissez des détails sur les rubriques découvertes par LightLDA.
NgramExtractingEstimator	Produit un vecteur de nombres de n-grammes (séquences de mots consécutifs) rencontrés dans le texte d’entrée.
NgramExtractingTransformer	ITransformer résultant de l’ajustement d’un NgramExtractingEstimator.
NgramHashingEstimator	IEstimator<TTransformer> pour le NgramHashingTransformer.
NgramHashingTransformer	Espace de noms contenant des composants de transformation de données de texte.
StopWordsRemovingEstimator	IEstimator<TTransformer> pour le CustomStopWordsRemovingTransformer.
StopWordsRemovingEstimator.Options	Utilisez le remover de mots vides qui peut supprimer la liste de mots stop spécifiques à la langue (mots les plus courants) déjà défini dans le système.
StopWordsRemovingTransformer	ITransformer résultant de l’ajustement d’un StopWordsRemovingEstimator.
TextFeaturizingEstimator	Estimateur qui transforme une collection de documents texte en vecteurs de caractéristique numérique. Les vecteurs de caractéristiques sont des nombres normalisés de mots et/ou de caractères n-grammes (en fonction des options fournies).
TextFeaturizingEstimator.Options	Options avancées pour le TextFeaturizingEstimator.
TextNormalizingEstimator	IEstimator<TTransformer> pour le TextNormalizingTransformer.
TextNormalizingTransformer	ITransformer résultant de l’ajustement d’un TextNormalizingEstimator.
TokenizingByCharactersEstimator	IEstimator<TTransformer> pour le TokenizingByCharactersTransformer.
TokenizingByCharactersTransformer	ITransformer résultant de l’ajustement d’un TokenizingByCharactersEstimator.
WordBagEstimator	IEstimator<TTransformer> pour le ITransformer.
WordBagEstimator.Options	Options pour l’extraction des n-grammes.
WordEmbeddingEstimator	Caractérisation de texte qui convertit les vecteurs de jetons de texte en vecteur numérique à l’aide d’un modèle d’incorporation préentraîné.
WordEmbeddingTransformer	ITransformer résultant de l’ajustement d’un WordEmbeddingEstimator.
WordHashBagEstimator	IEstimator<TTransformer> pour le ITransformer.
WordTokenizingEstimator	Tokenise le texte d’entrée à l’aide de délimiteurs spécifiés.
WordTokenizingTransformer	ITransformer résultant de l’ajustement d’un WordTokenizingEstimator.

Structures

LatentDirichletAllocationTransformer.ModelParameters.ItemScore	Espace de noms contenant des composants de transformation de données de texte.
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore	Espace de noms contenant des composants de transformation de données de texte.

Interfaces

IStopWordsRemoverOptions

Définit le type de suppression de mots vides pris en charge.

Énumérations

NgramExtractingEstimator.WeightingCriteria	Mesure statistique utilisée pour évaluer l’importance d’un mot dans un corpus. Cette énumération est sérialisée.
StopWordsRemovingEstimator.Language	Langue des mots vides. Cette énumération est sérialisée.
TextFeaturizingEstimator.Language	Langue du texte. Cette énumération est sérialisée.
TextFeaturizingEstimator.NormFunction	Type de normaliseur de vecteur de texte.
TextNormalizingEstimator.CaseMode	Mode de normalisation de la casse du texte. Cette énumération est sérialisée.
WordEmbeddingEstimator.PretrainedModelKind	Spécifie les incorporations de mots à utiliser.

Partager via

Microsoft.ML.Transforms.Text Espace de noms

Classes

Structures

Interfaces

Énumérations

Ressources supplémentaires