Partilhar via


PatternAnalyzer interface

Separa o texto de forma flexível em termos através de um padrão de expressão regular. Este analisador é implementado usando Apache Lucene.

Propriedades

flags

Sinalizadores de expressão regular. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

lowerCaseTerms

Um valor que indica se os termos devem ser minúsculos. O padrão é true. Valor padrão: true.

name

O nome do analisador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

odatatype

Discriminador Polimórfico

pattern

Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: \W+.

stopwords

Uma lista de palavras-chave.

Detalhes de Propriedade

flags

Sinalizadores de expressão regular. Os valores possíveis incluem: 'CANON_EQ', 'CASE_INSENSITIVE', 'COMMENTS', 'DOTALL', 'LITERAL', 'MULTILINE', 'UNICODE_CASE', 'UNIX_LINES'

flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

Valor de Propriedade

("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]

lowerCaseTerms

Um valor que indica se os termos devem ser minúsculos. O padrão é true. Valor padrão: true.

lowerCaseTerms?: boolean

Valor de Propriedade

boolean

name

O nome do analisador. Deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode começar e terminar com caracteres alfanuméricos e está limitado a 128 caracteres.

name: string

Valor de Propriedade

string

odatatype

Discriminador Polimórfico

odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"

Valor de Propriedade

"#Microsoft.Azure.Search.PatternAnalyzer"

pattern

Um padrão de expressão regular para corresponder aos separadores de token. O padrão é uma expressão que corresponde a um ou mais caracteres de espaço em branco. Valor padrão: \W+.

pattern?: string

Valor de Propriedade

string

stopwords

Uma lista de palavras-chave.

stopwords?: string[]

Valor de Propriedade

string[]