你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

MicrosoftLanguageTokenizer 类

参考

定义

命名空间:: Microsoft.Azure.Search.Models

程序集:: Microsoft.Azure.Search.Service.dll

包:: Microsoft.Azure.Search.Service v10.1.0

Source:: MicrosoftLanguageTokenizer.cs

重要

一些信息与预发行产品相关，相应产品在发行之前可能会进行重大修改。对于此处提供的信息，Microsoft 不作任何明示或暗示的担保。

使用特定于语言的规则划分文本。

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageTokenizer")]
public class MicrosoftLanguageTokenizer : Microsoft.Azure.Search.Models.Tokenizer

[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.MicrosoftLanguageTokenizer")>]
type MicrosoftLanguageTokenizer = class
    inherit Tokenizer

Public Class MicrosoftLanguageTokenizer
Inherits Tokenizer

继承: Object

Tokenizer
MicrosoftLanguageTokenizer

属性: Newtonsoft.Json.JsonObjectAttribute

构造函数

MicrosoftLanguageTokenizer()	初始化 MicrosoftLanguageTokenizer 类的新实例。
MicrosoftLanguageTokenizer(String, Nullable<Int32>, Nullable<Boolean>, Nullable<MicrosoftTokenizerLanguage>)	初始化 MicrosoftLanguageTokenizer 类的新实例。

属性

IsSearchTokenizer	获取或设置一个值，该值指示如何使用 tokenizer。如果用作搜索 tokenizer，则设置为 true;如果用作索引标记器，则设置为 false。默认值为 false。
Language	获取或设置要使用的语言。默认值为英语。可能的值包括：“bangla”、“保加利亚”、“加泰罗尼亚”、“chineseSimplified”、“chineseTraditional”、“croatian”、“czech”、“danish”、“dutch”、“english”、“english”、“french”、“german”、“greek”、“gujarati”、“印地语”、“冰岛语”、“印尼语”、 'italian'， 'japanese'， 'kannada'， 'korean'， 'malayalam'， '马拉雅拉姆姆'， 'marathi'， '挪威Bokmaal'， 'polish'， '葡萄牙语'， 'portugueseBrazilian'， 'punjabi'， '罗马尼亚语'， 'russian'， '塞尔维亚语'， '塞尔维亚语'， '塞尔维亚拉丁'， '斯洛文尼亚'， 'spanish'， 'swedish'， 'tamil'， 'telugu'， 'thai'， '乌克兰'， 'urdu'， 'vietnamese'
MaxTokenLength	获取或设置最大令牌长度。超过最大长度的标记将被拆分。可以使用的最大标记长度为 300 个字符。长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌，然后根据设置的最大令牌长度拆分每个令牌。默认值为 255。
Name	获取或设置 tokenizer 的名称。它必须仅包含字母、数字、空格、短划线或下划线，只能以字母数字字符开头和结尾，且最多包含 128 个字符。 (继承自 Tokenizer)

方法

Validate()

验证对象。

适用于

通过

MicrosoftLanguageTokenizer 类

定义

构造函数

属性

方法

适用于

其他资源