次の方法で共有


StandardTokenizerV2 クラス

定義

Unicode テキスト セグメント化ルールに従ってテキストを分割します。 このトークナイザーは、Apache Lucene を使用して実装されます。 http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.StandardTokenizerV2")]
public class StandardTokenizerV2 : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.StandardTokenizerV2")>]
type StandardTokenizerV2 = class
    inherit Tokenizer
Public Class StandardTokenizerV2
Inherits Tokenizer
継承
StandardTokenizerV2
属性
Newtonsoft.Json.JsonObjectAttribute

コンストラクター

StandardTokenizerV2()

StandardTokenizerV2 クラスの新しいインスタンスを初期化します。

StandardTokenizerV2(String, Nullable<Int32>)

StandardTokenizerV2 クラスの新しいインスタンスを初期化します。

プロパティ

MaxTokenLength

トークンの最大長を取得または設定します。 既定値は 255 です。 最大長より長いトークンは分割されます。 使用できる最大トークン長は 300 文字です。

Name

トークナイザーの名前を取得または設定します。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

(継承元 Tokenizer)

メソッド

Validate()

オブジェクトを検証します。

適用対象