DictionaryDecompounderTokenFilter クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
多くのゲルマン言語に出現する複合語を分解します。 このトークン フィルターは、Apache Lucene を使用して実装されます。
public class DictionaryDecompounderTokenFilter : Azure.Search.Documents.Indexes.Models.TokenFilter
type DictionaryDecompounderTokenFilter = class
inherit TokenFilter
Public Class DictionaryDecompounderTokenFilter
Inherits TokenFilter
- 継承
コンストラクター
DictionaryDecompounderTokenFilter(String, IEnumerable<String>) |
DictionaryDecompounderTokenFilter の新しいインスタンスを初期化します。 |
プロパティ
MaxSubwordSize |
サブワードの最大サイズ。 これより短いサブワードのみが出力されます。 既定値は 15 です。 最大値は 300 です。 |
MinSubwordSize |
サブワードの最小サイズ。 これより長いサブワードのみが出力されます。 既定値は 2 です。 最大値は 300 です。 |
MinWordSize |
単語の最小サイズ。 これより長い単語のみが処理されます。 既定値は 5 です。 最大値は 300 です。 |
Name |
トークン フィルターの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 TokenFilter) |
OnlyLongestMatch |
最も長い一致するサブワードのみを出力に追加するかどうかを示す値。 既定値は false です。 |
WordList |
照合する単語の一覧。 |