你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
PatternAnalyzer interface
通过正则表达式模式将文本灵活地分解成多个词条。 此分析器是使用 Apache Lucene 实现的。
属性
flags | 正则表达式标志。 可能的值包括:“CANON_EQ”、“CASE_INSENSITIVE”、“COMMENTS”、“DOTALL”、“LITERAL”、“MULTILINE”、“UNICODE_CASE”、“UNIX_LINES” |
lower |
一个 值,该值指示是否应将字词小写。 默认为 true。 默认值:true。 |
name | 分析器的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。 |
odatatype | 多态鉴别器 |
pattern | 用于匹配标记分隔符的正则表达式模式。 默认值是匹配一个或多个空格字符的表达式。 默认值: |
stopwords | 非索引字列表。 |
属性详细信息
flags
正则表达式标志。 可能的值包括:“CANON_EQ”、“CASE_INSENSITIVE”、“COMMENTS”、“DOTALL”、“LITERAL”、“MULTILINE”、“UNICODE_CASE”、“UNIX_LINES”
flags?: ("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
属性值
("CANON_EQ" | "CASE_INSENSITIVE" | "COMMENTS" | "DOTALL" | "LITERAL" | "MULTILINE" | "UNICODE_CASE" | "UNIX_LINES")[]
lowerCaseTerms
一个 值,该值指示是否应将字词小写。 默认为 true。 默认值:true。
lowerCaseTerms?: boolean
属性值
boolean
name
分析器的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。
name: string
属性值
string
odatatype
多态鉴别器
odatatype: "#Microsoft.Azure.Search.PatternAnalyzer"
属性值
"#Microsoft.Azure.Search.PatternAnalyzer"
pattern
用于匹配标记分隔符的正则表达式模式。 默认值是匹配一个或多个空格字符的表达式。 默认值:\W+
。
pattern?: string
属性值
string
stopwords
非索引字列表。
stopwords?: string[]
属性值
string[]