你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
MicrosoftLanguageTokenizer 构造函数
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
重载
MicrosoftLanguageTokenizer() |
初始化 MicrosoftLanguageTokenizer 类的新实例。 |
MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>) |
初始化 MicrosoftLanguageTokenizer 类的新实例。 |
MicrosoftLanguageTokenizer()
初始化 MicrosoftLanguageTokenizer 类的新实例。
public MicrosoftLanguageTokenizer ();
Public Sub New ()
适用于
MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)
初始化 MicrosoftLanguageTokenizer 类的新实例。
public MicrosoftLanguageTokenizer (string name, int? maxTokenLength = default, bool? isSearchTokenizer = default, Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage? language = default);
new Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer : string * Nullable<int> * Nullable<bool> * Nullable<Microsoft.Azure.Search.Models.MicrosoftTokenizerLanguage> -> Microsoft.Azure.Search.Models.MicrosoftLanguageTokenizer
Public Sub New (name As String, Optional maxTokenLength As Nullable(Of Integer) = Nothing, Optional isSearchTokenizer As Nullable(Of Boolean) = Nothing, Optional language As Nullable(Of MicrosoftTokenizerLanguage) = Nothing)
参数
- name
- String
tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。
最大令牌长度。 超过最大长度的标记将被拆分。 可以使用的最大标记长度为 300 个字符。 长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌,然后根据设置的最大令牌长度拆分每个令牌。 默认值为 255。
一个指示如何使用 tokenizer 的值。 如果用作搜索 tokenizer,则设置为 true;如果用作索引标记器,则设置为 false。 默认值为 false。
- language
- Nullable<MicrosoftTokenizerLanguage>
要使用的语言。 默认值为英语。 可能的值包括:“bangla”、“保加利亚”、“加泰罗尼亚”、“chineseSimplified”、“chineseTraditional”、“croatian”、“czech”、“danish”、“dutch”、“english”、“english”、“french”、“german”、“greek”、“gujarati”、“印地语”、“冰岛语”、“印尼语”、 'italian', 'japanese', 'kannada', 'korean', 'malayalam', '马拉雅拉姆姆', 'marathi', '挪威Bokmaal', 'polish', '葡萄牙语', 'portugueseBrazilian', 'punjabi', '罗马尼亚语', 'russian', '塞尔维亚语', '塞尔维亚语', '塞尔维亚拉丁', '斯洛文尼亚', 'spanish', 'swedish', 'tamil', 'telugu', 'thai', '乌克兰', 'urdu', 'vietnamese'