Partilhar via


TransformsCatalog.TextTransforms Classe

Definição

Classe usada por MLContext para criar instâncias de componentes de transformação de dados de texto.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Herança
TransformsCatalog.TextTransforms

Métodos de Extensão

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte um vetor de texto em um vetor numérico usando modelos de inserções pré-treinados.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte vetores de texto em vetores numéricos usando modelos de inserções pré-treinados.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque de Single que representa contagens normalizadas de n-gramas e char-grams.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque de Single que representa contagens normalizadas de n-gramas e char-grams.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Crie um LatentDirichletAllocationEstimator, que usa LightLDA para transformar texto (representado como um vetor de floats) em um vetor de Single indicando a similaridade do texto com cada tópico identificado.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Cria um TextNormalizingEstimator, que normaliza o texto de entrada em inputColumnName , opcionalmente, alterando maiúsculas e minúsculas, removendo marcas diacríticas, marcas de pontuação, números e gera um novo texto como outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Crie um NgramHashingEstimator, que copia os dados da coluna especificada em inputColumnName para uma nova coluna: outputColumnName e produz um vetor de contagens de n-gramas com hash.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Crie um NgramHashingEstimator, que leva os dados das várias colunas especificadas em inputColumnNames para uma nova coluna: outputColumnName e produz um vetor de contagens de n-gramas com hash.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Crie um WordHashBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-grams com hash em uma nova coluna chamada outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Crie um WordHashBagEstimator, que mapeia as várias colunas especificadas em inputColumnNames para um vetor de contagens de n-gramas com hash em uma nova coluna chamada outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cria um NgramExtractingEstimator que produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia as várias colunas especificadas em inputColumnNames para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em inputColumnName para uma nova coluna: outputColumnName e remove um conjunto predicado de texto específico para language ele.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em inputColumnName para uma nova coluna: outputColumnName e remove o texto especificado nele stopwords .

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Crie um TokenizingByCharactersEstimator, que gera tokens dividindo o texto em sequências de caracteres usando uma janela deslizante.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Crie um WordTokenizingEstimator, que gera tokens de texto de entrada usando separators como separadores.

Aplica-se a