Compartilhar via


EdgeNGramTokenizer interface

Tokeniza a entrada de uma borda em n-gramas dos tamanhos fornecidos. Esse criador de tokens é implementado usando o Apache Lucene.

Extends

Propriedades

maxGram

O comprimento máximo de n-grama. O padrão é 2. O máximo é 300.

minGram

O comprimento mínimo de n-grama. O padrão é UTF-1. O máximo é 300. Deve ser menor que o valor de maxGram.

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

tokenChars

Classes de caracteres a serem mantidas nos tokens.

Propriedades herdadas

name

O nome do criador de tokens. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

Detalhes da propriedade

maxGram

O comprimento máximo de n-grama. O padrão é 2. O máximo é 300.

maxGram?: number

Valor da propriedade

number

minGram

O comprimento mínimo de n-grama. O padrão é UTF-1. O máximo é 300. Deve ser menor que o valor de maxGram.

minGram?: number

Valor da propriedade

number

odatatype

Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser

odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"

Valor da propriedade

"#Microsoft.Azure.Search.EdgeNGramTokenizer"

tokenChars

Classes de caracteres a serem mantidas nos tokens.

tokenChars?: TokenCharacterKind[]

Valor da propriedade

Detalhes das propriedades herdadas

name

O nome do criador de tokens. Deve conter apenas letras, números, espaços, traços ou sublinhados, pode começar e terminar apenas com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor da propriedade

string

Herdado deBaseLexicalTokenizer.name