Microsoft.ML.Transforms.Text Namespace
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Namespace contendo componentes de transformação de dados de texto.
Classes
CustomStopWordsRemovingEstimator |
IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer. |
CustomStopWordsRemovingEstimator.Options |
Use o removedores de palavras stop que podem remover a lista específica de linguagem de palavras de parada (palavras mais comuns) já definidas no sistema. |
CustomStopWordsRemovingTransformer |
ITransformer resultante da montagem de um CustomStopWordsRemovingEstimator. |
LatentDirichletAllocationEstimator |
A transformação LDA implementa o LightLDA, uma implementação de última geração da Alocação de Dirichlet Latente. |
LatentDirichletAllocationTransformer |
ITransformer resultante da montagem de um LatentDirichletAllocationEstimator. |
LatentDirichletAllocationTransformer.ModelParameters |
Forneça detalhes sobre os tópicos descobertos pelo LightLDA. |
NgramExtractingEstimator |
Produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada. |
NgramExtractingTransformer |
ITransformer resultante da montagem de um NgramExtractingEstimator. |
NgramHashingEstimator | |
NgramHashingTransformer |
Namespace contendo componentes de transformação de dados de texto. |
StopWordsRemovingEstimator |
IEstimator<TTransformer> para o CustomStopWordsRemovingTransformer. |
StopWordsRemovingEstimator.Options |
Use o removedores de palavras stop que podem remover a lista específica de idioma de palavras irrelevantes (palavras mais comuns) já definidas no sistema. |
StopWordsRemovingTransformer |
ITransformer resultante da montagem de um StopWordsRemovingEstimator. |
TextFeaturizingEstimator |
Um estimador que transforma uma coleção de documentos de texto em vetores de recursos numéricos. Os vetores de recurso são contagens normalizadas de n-gramas de palavra e/ou caractere (com base nas opções fornecidas). |
TextFeaturizingEstimator.Options |
Opções avançadas para o TextFeaturizingEstimator. |
TextNormalizingEstimator | |
TextNormalizingTransformer |
ITransformer resultante da montagem de um TextNormalizingEstimator. |
TokenizingByCharactersEstimator |
IEstimator<TTransformer> para o TokenizingByCharactersTransformer. |
TokenizingByCharactersTransformer |
ITransformer resultante da montagem de um TokenizingByCharactersEstimator. |
WordBagEstimator |
IEstimator<TTransformer> para o ITransformer. |
WordBagEstimator.Options |
Opções de como os n-gramas são extraídos. |
WordEmbeddingEstimator |
Recurso de texto que converte vetores de tokens de texto em um vetor numérico usando um modelo de incorporações pré-treinado. |
WordEmbeddingTransformer |
ITransformer resultante da montagem de um WordEmbeddingEstimator. |
WordHashBagEstimator |
IEstimator<TTransformer> para o ITransformer. |
WordTokenizingEstimator |
Tokeniza o texto de entrada usando delimitadores especificados. |
WordTokenizingTransformer |
ITransformer resultante da montagem de um WordTokenizingEstimator. |
Estruturas
LatentDirichletAllocationTransformer.ModelParameters.ItemScore |
Namespace contendo componentes de transformação de dados de texto. |
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore |
Namespace contendo componentes de transformação de dados de texto. |
Interfaces
IStopWordsRemoverOptions |
Define o tipo diferente de removedores de palavras de parada com suporte. |
Enumerações
NgramExtractingEstimator.WeightingCriteria |
Uma medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus. Essa enumeração é serializada. |
StopWordsRemovingEstimator.Language |
Linguagem stopwords. Essa enumeração é serializada. |
TextFeaturizingEstimator.Language |
Linguagem de texto. Essa enumeração é serializada. |
TextFeaturizingEstimator.NormFunction |
Tipo de normalizador de vetor de texto. |
TextNormalizingEstimator.CaseMode |
Modo de normalização de maiúsculas e minúsculas de texto. Essa enumeração é serializada. |
WordEmbeddingEstimator.PretrainedModelKind |
Especifica quais inserções de palavra usar. |