EdgeNGramTokenizer interface
Tokeniza a entrada de uma borda em n-gramas do(s) tamanho(s) determinado(s). Este tokenizador é implementado usando Apache Lucene.
- Extends
Propriedades
max |
O comprimento máximo de n-gramas. O padrão é 2. O máximo é de 300. |
min |
O comprimento mínimo de n-gramas. O padrão é 1. O máximo é de 300. Deve ser menor que o valor de maxGram. |
odatatype | Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser |
token |
Classes de caracteres para manter nos tokens. |
Propriedades Herdadas
name | O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres. |
Detalhes de Propriedade
maxGram
O comprimento máximo de n-gramas. O padrão é 2. O máximo é de 300.
maxGram?: number
Valor de Propriedade
number
minGram
O comprimento mínimo de n-gramas. O padrão é 1. O máximo é de 300. Deve ser menor que o valor de maxGram.
minGram?: number
Valor de Propriedade
number
odatatype
Discriminador polimórfico, que especifica os diferentes tipos que este objeto pode ser
odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"
Valor de Propriedade
"#Microsoft.Azure.Search.EdgeNGramTokenizer"
tokenChars
Classes de caracteres para manter nos tokens.
tokenChars?: TokenCharacterKind[]
Valor de Propriedade
Detalhes da Propriedade Herdada
name
O nome do tokenizador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.
name: string
Valor de Propriedade
string
herdada deBaseLexicalTokenizer.name