PatternTokenizer クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
正規表現パターン マッチングを使用して個別のトークンを構築するトークナイザー。 このトークナイザーは、Apache Lucene を使用して実装されます。
public class PatternTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type PatternTokenizer = class
inherit LexicalTokenizer
Public Class PatternTokenizer
Inherits LexicalTokenizer
- 継承
コンストラクター
PatternTokenizer(String) |
PatternTokenizer の新しいインスタンスを初期化します。 |
プロパティ
Flags |
の Pattern正規表現フラグ。 |
Group |
トークンに抽出する正規表現パターン内の一致するグループの 0 から始まる序数。 一致するグループに関係なく、パターン全体を使用して入力をトークンに分割する場合は、-1 を使用します。 既定値は -1 です。 |
Name |
トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 LexicalTokenizer) |
Pattern |
トークン区切り記号と一致する正規表現パターン。 既定値は、1 つ以上の単語以外の文字と一致する式です。 |