LuceneStandardTokenizer クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
Unicode テキスト セグメント化ルールに従ってテキストを分割します。 このトークナイザーは、Apache Lucene を使用して実装されます。
public class LuceneStandardTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type LuceneStandardTokenizer = class
inherit LexicalTokenizer
Public Class LuceneStandardTokenizer
Inherits LexicalTokenizer
- 継承
コンストラクター
LuceneStandardTokenizer(String) |
LuceneStandardTokenizer の新しいインスタンスを初期化します。 |
プロパティ
MaxTokenLength |
トークンの最大長。 既定値は 255 です。 最大長より長いトークンは分割されます。 使用できる最大トークン長は 300 文字です。 |
Name |
トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 LexicalTokenizer) |
適用対象
GitHub で Microsoft と共同作業する
このコンテンツのソースは GitHub にあります。そこで、issue や pull request を作成および確認することもできます。 詳細については、共同作成者ガイドを参照してください。
Azure SDK for .NET