WordDelimiterTokenFilter クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
単語がサブ単語に分割され、部分語のグループに対してオプションの変換が実行されます。 このトークン フィルターは、Apache Lucene を使用して実装されます。
public class WordDelimiterTokenFilter : Azure.Search.Documents.Indexes.Models.TokenFilter
type WordDelimiterTokenFilter = class
inherit TokenFilter
Public Class WordDelimiterTokenFilter
Inherits TokenFilter
- 継承
コンストラクター
WordDelimiterTokenFilter(String) |
WordDelimiterTokenFilter の新しいインスタンスを初期化します。 |
プロパティ
CatenateAll |
すべてのサブワード部分を分類するかどうかを示す 値。 たとえば、これが true に設定されている場合、"Azure-Search-1" は "AzureSearch1" になります。 既定値は false です。 |
CatenateNumbers |
数値部分の最大実行数を分類するかどうかを示す値。 たとえば、これが true に設定されている場合、"1-2" は "12" になります。 既定値は false です。 |
CatenateWords |
単語部分の最大実行数を分類するかどうかを示す値。 たとえば、これが true に設定されている場合、"Azure-Search" は "AzureSearch" になります。 既定値は false です。 |
GenerateNumberParts |
数値サブワードを生成するかどうかを示す値。 既定値は true です。 |
GenerateWordParts |
パートワードを生成するかどうかを示す値。 が設定されている場合、単語の一部が生成されます。たとえば、"AzureSearch" は "Azure" "Search" になります。 既定値は true です。 |
Name |
トークン フィルターの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 TokenFilter) |
PreserveOriginal |
元の単語を保持し、サブワード リストに追加するかどうかを示す値。 既定値は false です。 |
ProtectedWords |
区切られるのを防ぎ、保護するトークンの一覧。 |
SplitOnCaseChange |
caseChange で単語を分割するかどうかを示す値。 たとえば、これが true に設定されている場合、"AzureSearch" は "Azure" "Search" になります。 既定値は true です。 |
SplitOnNumerics |
数値で分割するかどうかを示す値。 たとえば、これが true に設定されている場合、"Azure1Search" は "Azure" "1" "Search" になります。 既定値は true です。 |
StemEnglishPossessive |
各サブワードの末尾の "'s" を削除するかどうかを示す値。 既定値は true です。 |