Compartir a través de


TransformsCatalog.TextTransforms Clase

Definición

Clase usada por MLContext para crear instancias de componentes de transformación de datos de texto.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Herencia
TransformsCatalog.TextTransforms

Métodos de extensión

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte un vector de texto en un vector numérico mediante modelos de incrustación previamente entrenados.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Cree un WordEmbeddingEstimator, que es un caracterizador de texto que convierte vectores de texto en vectores numéricos mediante modelos de incrustación previamente entrenados.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Cree un TextFeaturizingEstimatorobjeto , que transforma una columna de texto en vector con caracterización de Single que representa recuentos normalizados de n-gramas y caracteres.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Cree un TextFeaturizingEstimatorobjeto , que transforma una columna de texto en un vector con características de Single que representa recuentos normalizados de n-gramas y caracteres.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Cree un LatentDirichletAllocationEstimatorobjeto , que usa LightLDA para transformar texto (representado como vector de floats) en un vector de Single que indique la similitud del texto con cada tema identificado.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Crea un TextNormalizingEstimatorobjeto , que normaliza el texto entrante en inputColumnName cambiando opcionalmente mayúsculas de minúsculas, quitando marcas diacríticas, signos de puntuación, números y genera texto nuevo como outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Cree un NgramHashingEstimatorobjeto , que copia los datos de la columna especificada en inputColumnName en una nueva columna: outputColumnName y genera un vector de recuentos de n-gramas con hash.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Cree un NgramHashingEstimatorobjeto , que toma los datos de las varias columnas especificadas en inputColumnNames una nueva columna: outputColumnName y genera un vector de recuentos de n-gramas con hash.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Cree un WordHashBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas con hash en una nueva columna denominada outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Cree un WordHashBagEstimatorobjeto , que asigna las varias columnas especificadas en inputColumnNames a un vector de recuentos de n-gramas con hash en una nueva columna denominada outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crea un NgramExtractingEstimator objeto que genera un vector de recuentos de n-gramas (secuencias de palabras consecutivas) encontrados en el texto de entrada.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en inputColumnNames a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en inputColumnName en una nueva columna: outputColumnName y quita el conjunto predifined de texto específico para language él.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Cree un CustomStopWordsRemovingEstimatorobjeto , que copia los datos de la columna especificada en inputColumnName en una nueva columna: outputColumnName y quita el texto especificado en stopwords de ella.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Cree un TokenizingByCharactersEstimatorobjeto , que tokeniza dividiendo el texto en secuencias de caracteres mediante una ventana deslizante.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Cree un WordTokenizingEstimatorobjeto , que tokeniza el texto de entrada mediante separators como separadores.

Se aplica a