WordDelimiterTokenFilter Classe
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Divide as palavras em subpalavras e realiza transformações opcionais em grupos de subpalavras. Esse filtro de token é implementado usando o Apache Lucene.
public class WordDelimiterTokenFilter : Azure.Search.Documents.Indexes.Models.TokenFilter
type WordDelimiterTokenFilter = class
inherit TokenFilter
Public Class WordDelimiterTokenFilter
Inherits TokenFilter
- Herança
Construtores
WordDelimiterTokenFilter(String) |
Inicializa uma nova instância do WordDelimiterTokenFilter. |
Propriedades
CatenateAll |
Um valor que indica se todas as partes de sub palavra serão categorizadas. Por exemplo, se isso for definido como true, "Azure-Search-1" se tornará "AzureSearch1". O padrão é false. |
CatenateNumbers |
Um valor que indica se as execuções máximas de partes numéricas serão categorizadas. Por exemplo, se isso for definido como true, "1-2" se tornará "12". O padrão é false. |
CatenateWords |
Um valor que indica se as execuções máximas de partes de palavra serão categorizadas. Por exemplo, se isso for definido como true, "Azure-Search" se tornará "AzureSearch". O padrão é false. |
GenerateNumberParts |
Um valor que indica se as sub palavras numéricas devem ser geradas. O padrão é true. |
GenerateWordParts |
Um valor que indica se as palavras de parte devem ser geradas. Se definido, faz com que partes de palavras sejam geradas; por exemplo, "AzureSearch" torna-se "Azure" "Search". O padrão é true. |
Name |
O nome do filtro de token. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres. (Herdado de TokenFilter) |
PreserveOriginal |
Um valor que indica se as palavras originais serão preservadas e adicionadas à lista de sub palavras. O padrão é false. |
ProtectedWords |
Uma lista de tokens para proteger contra serem delimitados. |
SplitOnCaseChange |
Um valor que indica se as palavras devem ser divididas em caseChange. Por exemplo, se isso for definido como true, "AzureSearch" se tornará "Azure" "Search". O padrão é true. |
SplitOnNumerics |
Um valor que indica se os números devem ser divididos. Por exemplo, se isso for definido como true, "Azure1Search" se tornará "Azure" "1" "Search". O padrão é true. |
StemEnglishPossessive |
Um valor que indica se é necessário remover "'s" à direita para cada sub palavra. O padrão é true. |