你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
EdgeNGramTokenizer 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
将来自边缘的输入标记化为给定大小的 n 元语法 (s) 。 此 tokenizer 是使用 Apache Lucene 实现的。 https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.EdgeNGramTokenizer")]
public class EdgeNGramTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.EdgeNGramTokenizer")>]
type EdgeNGramTokenizer = class
inherit Tokenizer
Public Class EdgeNGramTokenizer
Inherits Tokenizer
- 继承
- 属性
-
Newtonsoft.Json.JsonObjectAttribute
构造函数
EdgeNGramTokenizer() |
初始化 EdgeNGramTokenizer 类的新实例。 |
EdgeNGramTokenizer(String, Nullable<Int32>, Nullable<Int32>, IList<TokenCharacterKind>) |
初始化 EdgeNGramTokenizer 类的新实例。 |
属性
MaxGram |
获取或设置最大 n 元语法长度。 默认值为 2。 最大值为 300。 |
MinGram |
获取或设置最小 n 元语法长度。 默认值为 1。 最大值为 300。必须小于 maxGram 的值。 |
Name |
获取或设置 tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。 (继承自 Tokenizer) |
TokenChars |
获取或设置要保留在标记中的字符类。 |
方法
Validate() |
验证 对象。 |