MicrosoftLanguageStemmingTokenizer クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
言語固有のルールを使用してテキストが分割され、基本フォームに単語が減らされます。
public class MicrosoftLanguageStemmingTokenizer : Azure.Search.Documents.Indexes.Models.LexicalTokenizer
type MicrosoftLanguageStemmingTokenizer = class
inherit LexicalTokenizer
Public Class MicrosoftLanguageStemmingTokenizer
Inherits LexicalTokenizer
- 継承
コンストラクター
MicrosoftLanguageStemmingTokenizer(String) |
MicrosoftLanguageStemmingTokenizer の新しいインスタンスを初期化します。 |
プロパティ
IsSearchTokenizer |
トークナイザーの使用方法を示す値。 検索トークナイザーとして使用する場合は true に設定し、インデックス作成トークナイザーとして使用する場合は false に設定します。 既定値は false です。 |
Language |
使用する言語。 既定値は英語です。 |
MaxTokenLength |
トークンの最大長。 最大長より長いトークンは分割されます。 使用できる最大トークン長は、300 文字です。 300 文字を超えるトークンは、最初に長さ 300 のトークンに分割され、それらの各トークンは最大トークン長セットに基づいて分割されます。 既定値は 255 です。 |
Name |
トークナイザーの名前。 アルファベット、数字、空白、ダッシュ、アンダースコアのみを含める必要があります。また、最初と最後の文字は英数字にする必要があり、長さは 128 文字までに制限されています。 (継承元 LexicalTokenizer) |