NGramTokenizer Clase
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Tokeniza la entrada en n-gramas de tamaños dados. Este tokenizador se implementa mediante Apache Lucene.
public class NGramTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type NGramTokenizer = class
inherit LexicalTokenizer
Public Class NGramTokenizer
Inherits LexicalTokenizer
- Herencia
Constructores
NGramTokenizer(String) |
Inicializa una nueva instancia de NGramTokenizer. |
Propiedades
MaxGram |
Longitud máxima de n-gramas. El valor predeterminado es 2. El máximo es 300. |
MinGram |
Longitud mínima de n-gramas. El valor predeterminado es 1. El máximo es 300. Debe ser menor que el valor de maxGram. |
Name |
Nombre del tokenizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres. (Heredado de LexicalTokenizer) |
TokenChars |
Clases de caracteres que se mantendrán en los tokens. |