Compartir a través de


LuceneStandardTokenizer Clase

Definición

Divide el texto siguiendo las reglas de segmentación de texto Unicode. Este tokenizador se implementa mediante Apache Lucene.

public class LuceneStandardTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type LuceneStandardTokenizer = class
    inherit LexicalTokenizer
Public Class LuceneStandardTokenizer
Inherits LexicalTokenizer
Herencia
LuceneStandardTokenizer

Constructores

LuceneStandardTokenizer(String)

Inicializa una nueva instancia de LuceneStandardTokenizer.

Propiedades

MaxTokenLength

Longitud máxima del token. El valor predeterminado es 255. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es de 300 caracteres.

Name

Nombre del tokenizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres.

(Heredado de LexicalTokenizer)

Se aplica a