你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
EdgeNGramTokenizer interface
将来自边缘的输入标记化为给定大小的 n 元语法 (s) 。 此 tokenizer 是使用 Apache Lucene 实现的。
- Extends
属性
max |
最大 n 元语法长度。 默认值为 2。 最大值为 300。 |
min |
最小 n 元语法长度。 默认值为 1。 最大值为 300。 必须小于 maxGram 的值。 |
odatatype | 多态鉴别器,它指定此对象可以是的不同类型 |
token |
要保留在令牌中的字符类。 |
继承属性
name | tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。 |
属性详细信息
maxGram
最大 n 元语法长度。 默认值为 2。 最大值为 300。
maxGram?: number
属性值
number
minGram
最小 n 元语法长度。 默认值为 1。 最大值为 300。 必须小于 maxGram 的值。
minGram?: number
属性值
number
odatatype
多态鉴别器,它指定此对象可以是的不同类型
odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"
属性值
"#Microsoft.Azure.Search.EdgeNGramTokenizer"
tokenChars
继承属性详细信息
name
tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。
name: string
属性值
string