WordsSegmenter クラス
定義
重要
一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
指定されたテキストを単語または単語の語幹にセグメント化できるスセグメント化クラス (特定の言語に応じて)。
public ref class WordsSegmenter sealed
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, Windows.Foundation.UniversalApiContract)]
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
class WordsSegmenter final
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, "Windows.Foundation.UniversalApiContract")]
class WordsSegmenter final
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, typeof(Windows.Foundation.UniversalApiContract))]
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
public sealed class WordsSegmenter
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, "Windows.Foundation.UniversalApiContract")]
public sealed class WordsSegmenter
function WordsSegmenter(language)
Public NotInheritable Class WordsSegmenter
- 継承
- 属性
Windows の要件
デバイス ファミリ |
Windows 10 (10.0.10240.0 - for Xbox, see UWP features that aren't yet supported on Xbox で導入)
|
API contract |
Windows.Foundation.UniversalApiContract (v1.0 で導入)
|
注釈
単語間にスペースを使用しない言語 (日本語、中国語、韓国語、タイ語など) の場合、スセグメントを使用することは、キーワード (keyword)検索などのテキスト処理シナリオで個々の単語を取得する唯一の方法です。
このオブジェクトの構築時に指定された言語は、システム上のワード ブレーカーを持つ言語と照合され、使用可能な最適な単語セグメント化ルールが使用されます。 言語は、アプリでサポートされている言語の 1 つである必要はありません。 その言語に対して特にサポートされている言語規則がない場合は、言語に依存しない規則 ( Unicode 標準付属書 #29 Unicode テキスト セグメント化の実装) が使用され、 ResolvedLanguage プロパティは "und" (未確定言語) に設定されます。
キーワード (keyword)検索シナリオでは、常にテキスト コンテンツの言語でセグメント化を要求することをお勧めします。
スペル チェックのシナリオでは、一部の言語セグメント (ドイツ語など) は、1 つの複合語に対して複数の単語幹セグメントを返す場合があります。 これに対し、スペル チェック API では、単語を 1 つの単語としてまとめて保持することが想定される場合があります。 このような言語の場合は、"und" (未決定の言語) セゲライザーを明示的に要求することで、言語に依存しないセグメント化規則を強制することができます。 ただし、このようにすると、スペースのない言語の破壊的品質が大幅に低下します。 そのため、 Language.Script API を使用して、コンテンツ言語で次のいずれかの空白以外のスクリプトが使用されているかどうかを判断することをお勧めします。
スクリプト | Language |
---|---|
Bopo | Bopomofo |
Brah | Brahmi |
Egyp | エジプトヒエログリフ |
ゴス | ゴート文字 |
中止 | ハングル |
中止 | ひらがな |
中止 | 古いハングル |
ハニ語 | 韓 |
Ital | 古代イタリア文字 |
Java | ジャワ文字 |
Kana | カタカナ |
Khar | Kharoshthi |
Khmr | クメール語 |
Laoo | ラオス語 |
リス | リス |
Mymr | ミャンマー |
Talu | 新タイ ロ文字 |
タイ語 | タイ語 |
Tibt | チベット語 |
Xsux | 楔形文字 |
Yiii | イ語 |
これらのスクリプトが見つからない場合は、スペル チェック シナリオのセグメント化に "und" を使用しても問題ありません。
コンストラクター
WordsSegmenter(String) |
WordsSegmenter オブジェクトを作成します。 このコンストラクターに提供される言語の使用方法については、 WordsSegmenter の概要に関するページを参照してください。 |
プロパティ
ResolvedLanguage |
この WordsSegmenter オブジェクトで使用されるルールの言語を取得します。 言語に依存しないルールを使用している場合は、"und" (未確定) が返されます。 |
メソッド
GetTokenAt(String, UInt32) |
指定したインデックスを含む、または指定したテキストに従う単語または語幹を決定し、返します。 |
GetTokens(String) |
指定されたテキスト内のすべての単語または単語の語幹を決定して返します。 |
Tokenize(String, UInt32, WordSegmentsTokenizingHandler) |
指定されたインデックスの前と後の単語を指定されたテキストに反復処理する 2 つの反復子を使用して、指定されたハンドラーを呼び出します。 |