次の方法で共有


LuceneStandardTokenizer クラス

定義

Unicode テキスト セグメント化ルールに従ってテキストを分割します。 このトークナイザーは、Apache Lucene を使用して実装されます。

public class LuceneStandardTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type LuceneStandardTokenizer = class
    inherit LexicalTokenizer
Public Class LuceneStandardTokenizer
Inherits LexicalTokenizer
継承
LuceneStandardTokenizer

コンストラクター

LuceneStandardTokenizer(String)

LuceneStandardTokenizer の新しいインスタンスを初期化します。

プロパティ

MaxTokenLength

トークンの最大長。 既定値は 255 です。 最大長より長いトークンは分割されます。 使用できる最大トークン長は 300 文字です。

Name

トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。

(継承元 LexicalTokenizer)

適用対象