WordDelimiterTokenFilter Clase
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Divide palabras en subpalabras y realiza transformaciones opcionales en los grupos de subpalabras. Este filtro de token se implementa mediante Apache Lucene.
public class WordDelimiterTokenFilter : Azure.Search.Documents.Indexes.Models.TokenFilter
type WordDelimiterTokenFilter = class
inherit TokenFilter
Public Class WordDelimiterTokenFilter
Inherits TokenFilter
- Herencia
Constructores
WordDelimiterTokenFilter(String) |
Inicializa una nueva instancia de WordDelimiterTokenFilter. |
Propiedades
CatenateAll |
Valor que indica si todas las partes de subword se clasificarán. Por ejemplo, si se establece en true, "Azure-Search-1" se convierte en "AzureSearch1". El valor predeterminado es False. |
CatenateNumbers |
Valor que indica si se clasificarán las ejecuciones máximas de partes numéricas. Por ejemplo, si se establece en true, "1-2" se convierte en "12". El valor predeterminado es False. |
CatenateWords |
Valor que indica si se clasificarán las ejecuciones máximas de elementos de palabras. Por ejemplo, si se establece en true, "Azure-Search" se convierte en "AzureSearch". El valor predeterminado es False. |
GenerateNumberParts |
Valor que indica si se van a generar subpalabras numéricas. El valor predeterminado es true. |
GenerateWordParts |
Valor que indica si se van a generar palabras de parte. Si se establece, hace que se generen partes de palabras; por ejemplo, "AzureSearch" se convierte en "Azure" "Search". El valor predeterminado es true. |
Name |
Nombre del filtro de token. Solo puede contener letras, dígitos, espacios, guiones o guiones bajos, debe empezar y acabar con caracteres alfanuméricos y no puede superar los 128 caracteres. (Heredado de TokenFilter) |
PreserveOriginal |
Valor que indica si se conservarán las palabras originales y se agregarán a la lista de subwords. El valor predeterminado es False. |
ProtectedWords |
Lista de tokens que se van a proteger frente a delimitados. |
SplitOnCaseChange |
Valor que indica si se van a dividir palabras en caseChange. Por ejemplo, si se establece en true, "AzureSearch" se convierte en "Azure" "Search". El valor predeterminado es true. |
SplitOnNumerics |
Valor que indica si se va a dividir en números. Por ejemplo, si se establece en true, "Azure1Search" se convierte en "Azure" "1" "Search". El valor predeterminado es true. |
StemEnglishPossessive |
Valor que indica si se va a quitar "'s" final para cada subword. El valor predeterminado es true. |