Compartilhar via


CustomAnalyzer interface

Permite que você assuma o controle sobre o processo de conversão de texto em tokens indexáveis/pesquisáveis. É uma configuração definida pelo usuário que consiste em um único tokenizador predefinido e um ou mais filtros. O tokenizador é responsável por dividir texto em tokens e os filtros para modificar tokens emitidos pelo tokenizer.

Propriedades

charFilters

Uma lista de filtros de caractere usados para preparar o texto de entrada antes de ser processado pelo tokenizador. Por exemplo, eles podem substituir determinados caracteres ou símbolos. Os filtros são executados na ordem em que estão listados.

name

O nome do analisador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.

odatatype

Discriminatório polimórfico

tokenFilters

Uma lista de filtros de token usados para filtrar ou modificar os tokens gerados por um tokenizador. Por exemplo, você pode especificar um filtro em letras minúsculas que converte todos os caracteres em letras minúsculas. Os filtros são executados na ordem em que estão listados.

tokenizerName

O nome do tokenizador a ser usado para dividir o texto contínuo em uma sequência de tokens, como dividir uma frase em palavras. KnownTokenizerNames é uma enumeração que contém nomes de tokenizer internos.

Detalhes da propriedade

charFilters

Uma lista de filtros de caractere usados para preparar o texto de entrada antes de ser processado pelo tokenizador. Por exemplo, eles podem substituir determinados caracteres ou símbolos. Os filtros são executados na ordem em que estão listados.

charFilters?: string[]

Valor da propriedade

string[]

name

O nome do analisador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.

name: string

Valor da propriedade

string

odatatype

Discriminatório polimórfico

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

Valor da propriedade

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

Uma lista de filtros de token usados para filtrar ou modificar os tokens gerados por um tokenizador. Por exemplo, você pode especificar um filtro em letras minúsculas que converte todos os caracteres em letras minúsculas. Os filtros são executados na ordem em que estão listados.

tokenFilters?: string[]

Valor da propriedade

string[]

tokenizerName

O nome do tokenizador a ser usado para dividir o texto contínuo em uma sequência de tokens, como dividir uma frase em palavras. KnownTokenizerNames é uma enumeração que contém nomes de tokenizer internos.

tokenizerName: string

Valor da propriedade

string