Compartilhar via


NgramExtractingEstimator Classe

Definição

Produz um vetor de contagens de n-grams (sequências de palavras consecutivas) encontradas no texto de entrada.

public sealed class NgramExtractingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.NgramExtractingTransformer>
type NgramExtractingEstimator = class
    interface IEstimator<NgramExtractingTransformer>
Public NotInheritable Class NgramExtractingEstimator
Implements IEstimator(Of NgramExtractingTransformer)
Herança
NgramExtractingEstimator
Implementações

Comentários

Características do avaliador

Esse avaliador precisa examinar os dados para treinar seus parâmetros? Sim
Tipo de dados de coluna de entrada Vetor do tipo de chave .
Tipo de dados da coluna de saída Vetor de tamanho conhecido de Single
Exportável para ONNX Sim

O resultado NgramExtractingTransformer cria uma nova coluna, nomeada conforme especificado nos parâmetros de nome da coluna de saída, em que cada vetor de entrada é mapeado para um vetor de contagens de n-grams (sequências de palavras consecutivas) encontradas no texto de entrada.

O avaliador cria um dicionário de n-grams e NgramExtractingTransformer usa a ID no dicionário como o índice no vetor de contagem que ele produz.

Verifique a seção Consulte Também para obter links para exemplos de uso.

Métodos

Fit(IDataView)

Treina e retorna um NgramExtractingTransformer.

GetOutputSchema(SchemaShape)

Retorna o SchemaShape esquema que será produzido pelo transformador. Usado para propagação e verificação de esquema em um pipeline.

Métodos de Extensão

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Acrescente um 'ponto de verificação de cache' à cadeia do avaliador. Isso garantirá que os estimadores downstream sejam treinados em relação aos dados armazenados em cache. É útil ter um ponto de verificação de cache antes dos treinadores que levam vários passes de dados.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado um avaliador, retorne um objeto de encapsulamento que chamará um delegado uma vez Fit(IDataView) que seja chamado. Geralmente, é importante que um avaliador retorne informações sobre o que estava em forma, e é por isso que o Fit(IDataView) método retorna um objeto especificamente tipado, em vez de apenas um geral ITransformer. No entanto, ao mesmo tempo, IEstimator<TTransformer> muitas vezes são formados em pipelines com muitos objetos, portanto, talvez seja necessário criar uma cadeia de avaliadores por meio EstimatorChain<TLastTransformer> de onde o estimador para o qual queremos obter o transformador está enterrado em algum lugar nesta cadeia. Para esse cenário, podemos por meio desse método anexar um delegado que será chamado assim que o ajuste for chamado.

Aplica-se a

Confira também