你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

AnalyzeRequest 类

定义

指定一些用于将文本分解为标记的文本和分析组件。

public class AnalyzeRequest
type AnalyzeRequest = class
Public Class AnalyzeRequest
继承
AnalyzeRequest

构造函数

AnalyzeRequest()

初始化 AnalyzeRequest 类的新实例。

AnalyzeRequest(String, Nullable<AnalyzerName>, Nullable<TokenizerName>, IList<TokenFilterName>, IList<CharFilterName>)

初始化 AnalyzeRequest 类的新实例。

属性

Analyzer

获取或设置用于中断给定文本的分析器的名称。 如果未指定此参数,则必须改为指定 tokenizer。 tokenizer 和分析器参数是互斥的。 可能的值包括:“ar.microsoft”、“ar.lucene”、“hy.lucene”、 'bn.microsoft', 'eu.lucene', 'bg.microsoft', 'bg.lucene', 'ca.microsoft', 'ca.lucene', 'zh-Hans.microsoft', 'zh-Hans.lucene', 'zh-Hant.microsoft', 'hr.microsoft', 'cs.microsoft', 'cs.lucene', 'da.microsoft', 'da.lucene', 'nl.microsoft', 'nl.lucene', 'en.microsoft', 'en.lucene', 'et.microsoft', 'fi.microsoft', 'fi.lucene', 'fr.microsoft', 'fr.lucene', 'gl.lucene', 'de.microsoft', 'de.lucene',el.microsoft', 'el.lucene', 'gu.microsoft', 'he.microsoft', 'hi.microsoft', 'hi.lucene', 'hu.microsoft', 'hu.lucene', 'is.microsoft', 'id.microsoft', 'id.lucene', 'ga.lucene', 'it.microsoft', 'it.lucene', 'ja.lucene', 'ko.microsoft', 'ko.lucene', 'lv.microsoft', 'lv.lucene', 'lt.microsoft', 'ml.microsoft', 'ms.microsoft', 'mr.microsoft', 'nb.microsoft', 'no.lucene', 'fa.lucene', 'pl.microsoft', 'pl.lucene', 'pt-BR.microsoft', 'pt-BR.lucene',pt-PT.microsoft,'pt-PT.lucene', 'pa.microsoft', 'ro.microsoft', 'ro.lucene', 'ru.microsoft', 'ru.lucene', 'sr-cyrillic.microsoft', 'sr-latin.microsoft', 'sk.microsoft', 'sl.microsoft', 'es.microsoft', 'es.lucene', 'sv.microsoft', 'sv.lucene', 'ta.microsoft', 'te.microsoft', 'th.microsoft', 'th.lucene', 'tr.microsoft', 'tr.lucene', 'uk.microsoft', 'your.microsoft', 'vi.microsoft', 'standard.lucene', 'standardasciifolding.lucene', '关键字 (keyword) ', 'pattern', 'simple', 'stop', 'whitespace'

CharFilters

获取或设置在中断给定文本时要使用的字符筛选器的可选列表。 仅当使用 tokenizer 参数时,才能设置此参数。

Text

获取或设置要拆分为标记的文本。

TokenFilters

获取或设置在中断给定文本时要使用的标记筛选器的可选列表。 仅当使用 tokenizer 参数时,才能设置此参数。

Tokenizer

获取或设置用于中断给定文本的 tokenizer 的名称。 如果未指定此参数,则必须改为指定分析器。 tokenizer 和分析器参数是互斥的。 可能的值包括:“classic”、“edgeNGram”、“keyword_v2”、“letter”、“lowercase”、“microsoft_language_tokenizer”、“microsoft_language_stemming_tokenizer”、“nGram”、“path_hierarchy_v2”、“pattern”、“standard_v2”、“uax_url_email”、“whitespace”

方法

Validate()

验证 对象。

适用于