LuceneStandardTokenizer Clase
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Divide el texto siguiendo las reglas de segmentación de texto Unicode. Este tokenizador se implementa mediante Apache Lucene.
public class LuceneStandardTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type LuceneStandardTokenizer = class
inherit LexicalTokenizer
Public Class LuceneStandardTokenizer
Inherits LexicalTokenizer
- Herencia
Constructores
LuceneStandardTokenizer(String) |
Inicializa una nueva instancia de LuceneStandardTokenizer. |
Propiedades
MaxTokenLength |
Longitud máxima del token. El valor predeterminado es 255. Los tokens que sobrepasen la longitud máxima se dividen. La longitud máxima del token que se puede usar es de 300 caracteres. |
Name |
Nombre del tokenizador. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres. (Heredado de LexicalTokenizer) |
Se aplica a
Azure SDK for .NET