LuceneStandardTokenizer クラス

定義

重要

一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。

Unicode テキストセグメント化ルールに従ってテキストを分割します。このトークナイザーは、Apache Lucene を使用して実装されます。

public class LuceneStandardTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer

type LuceneStandardTokenizer = class
    inherit LexicalTokenizer

Public Class LuceneStandardTokenizer
Inherits LexicalTokenizer

LuceneStandardTokenizer の新しいインスタンスを初期化します。

MaxTokenLength	トークンの最大長。既定値は 255 です。最大長より長いトークンは分割されます。使用できる最大トークン長は 300 文字です。
Name	トークナイザーの名前。アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 LexicalTokenizer)