Compartilhar via


PatternAnalyzer interface

Separa o texto com flexibilidade em termos por meio de um padrão de expressão regular. Esse analisador é implementado usando o Apache Lucene.

Propriedades

flags

Sinalizadores de expressão regulares. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

lowerCaseTerms

Um valor que indica se os termos devem ser minúsculas. O padrão é verdadeiro. Valor padrão: true.

name

O nome do analisador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.

odatatype

Discriminatório polimórfico

pattern

Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: \W+.

stopwords

Uma lista de palavras irrelevantes.

Detalhes da propriedade

flags

Sinalizadores de expressão regulares. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Valor da propriedade

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

Um valor que indica se os termos devem ser minúsculas. O padrão é verdadeiro. Valor padrão: true.

lowerCaseTerms?: boolean

Valor da propriedade

boolean

name

O nome do analisador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.

name: string

Valor da propriedade

string

odatatype

Discriminatório polimórfico

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Valor da propriedade

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: \W+.

pattern?: string

Valor da propriedade

string

stopwords

Uma lista de palavras irrelevantes.

stopwords?: string[]

Valor da propriedade

string[]