CustomAnalyzer interface
Permite que você assuma o controle sobre o processo de conversão de texto em tokens indexáveis/pesquisáveis. É uma configuração definida pelo usuário que consiste em um único tokenizador predefinido e um ou mais filtros. O tokenizador é responsável por dividir texto em tokens e os filtros para modificar tokens emitidos pelo tokenizer.
Propriedades
char |
Uma lista de filtros de caractere usados para preparar o texto de entrada antes de ser processado pelo tokenizador. Por exemplo, eles podem substituir determinados caracteres ou símbolos. Os filtros são executados na ordem em que estão listados. |
name | O nome do analisador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres. |
odatatype | Discriminatório polimórfico |
token |
Uma lista de filtros de token usados para filtrar ou modificar os tokens gerados por um tokenizador. Por exemplo, você pode especificar um filtro em letras minúsculas que converte todos os caracteres em letras minúsculas. Os filtros são executados na ordem em que estão listados. |
tokenizer |
O nome do tokenizador a ser usado para dividir o texto contínuo em uma sequência de tokens, como dividir uma frase em palavras. KnownTokenizerNames é uma enumeração que contém nomes de tokenizer internos. |
Detalhes da propriedade
charFilters
Uma lista de filtros de caractere usados para preparar o texto de entrada antes de ser processado pelo tokenizador. Por exemplo, eles podem substituir determinados caracteres ou símbolos. Os filtros são executados na ordem em que estão listados.
charFilters?: string[]
Valor da propriedade
string[]
name
O nome do analisador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.
name: string
Valor da propriedade
string
odatatype
Discriminatório polimórfico
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
Valor da propriedade
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
Uma lista de filtros de token usados para filtrar ou modificar os tokens gerados por um tokenizador. Por exemplo, você pode especificar um filtro em letras minúsculas que converte todos os caracteres em letras minúsculas. Os filtros são executados na ordem em que estão listados.
tokenFilters?: string[]
Valor da propriedade
string[]
tokenizerName
O nome do tokenizador a ser usado para dividir o texto contínuo em uma sequência de tokens, como dividir uma frase em palavras. KnownTokenizerNames é uma enumeração que contém nomes de tokenizer internos.
tokenizerName: string
Valor da propriedade
string