WordsSegmenter 類別
定義
重要
部分資訊涉及發行前產品,在發行之前可能會有大幅修改。 Microsoft 對此處提供的資訊,不做任何明確或隱含的瑕疵擔保。
區段器類別,可根據特定語言) ,將提供的文字分割成單字或字幹 (。
public ref class WordsSegmenter sealed
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, Windows.Foundation.UniversalApiContract)]
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
class WordsSegmenter final
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 65536)]
/// [Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
/// [Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
/// [Windows.Foundation.Metadata.Activatable(Windows.Data.Text.IWordsSegmenterFactory, 65536, "Windows.Foundation.UniversalApiContract")]
class WordsSegmenter final
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, typeof(Windows.Foundation.UniversalApiContract))]
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
public sealed class WordsSegmenter
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 65536)]
[Windows.Foundation.Metadata.MarshalingBehavior(Windows.Foundation.Metadata.MarshalingType.Agile)]
[Windows.Foundation.Metadata.Threading(Windows.Foundation.Metadata.ThreadingModel.Both)]
[Windows.Foundation.Metadata.Activatable(typeof(Windows.Data.Text.IWordsSegmenterFactory), 65536, "Windows.Foundation.UniversalApiContract")]
public sealed class WordsSegmenter
function WordsSegmenter(language)
Public NotInheritable Class WordsSegmenter
- 繼承
- 屬性
Windows 需求
裝置系列 |
Windows 10 (已於 10.0.10240.0 - for Xbox, see UWP features that aren't yet supported on Xbox 引進)
|
API contract |
Windows.Foundation.UniversalApiContract (已於 v1.0 引進)
|
備註
對於在日文、中文、韓文和泰文) 等字 (組之間未使用空格的語言,使用區隔器是取得文字處理案例之個別單字的唯一方法,例如關鍵字搜尋。
建構此物件時所提供的語言會與系統上具有斷詞工具的語言進行比對,而且會使用最佳的文字分割規則。 語言不一定是應用程式的其中一種支援語言。 如果該語言沒有特別支援的語言規則,則會使用語言中性規則 (Unicode 標準附錄 #29 Unicode 文字分割) 實作, 而 ResolvedLanguage 屬性會設定為 「und」 (未決定的語言) 。
對於關鍵字搜尋案例,一律建議以文字內容的語言要求區段器。
針對拼字檢查案例,某些語言區段 (例如德文) 可能會傳回單一複合字組的多個字幹欄位。 相反地,拼字檢查 API 可能會預期單字會保持在一起。 針對這類語言,您可以選擇藉由明確要求「und」 (未決定的語言) 區段器來強制語言中性區隔規則。 不過,這麼做可大幅減少非空格語言的重大品質。 因此,建議您使用 Language.Script API 來判斷內容語言是否使用下列其中一個非空格腳本:
指令碼 | 語言 |
---|---|
Bopo | 注音符號 |
兄弟 | Brahmi |
Egyp | 埃吉那吉文 |
Goth | 哥 特 式 |
停止回應 | 韓文 |
停止回應 | 平假名 |
停止回應 | 舊韓文 |
哈尼文 | 漢 |
斜體 | 舊斜體 |
Java | 爪哇文 |
假名 | 片假名 |
Khar | Kharoshthi |
Khmr | 高棉文 |
Laoo | 寮文 |
傈僳族 | 傈僳族 |
Mymr | 緬甸 |
Talu | 新傣文 |
泰文 | 泰文 |
Tibt | 西藏文 |
Xsux | 楔 形 |
Y iii | 爨文 |
如果找不到這些腳本,則使用「und」 進行拼字檢查案例分割應該很安全。
建構函式
WordsSegmenter(String) |
建立 WordsSegmenter 物件。 如需如何使用此建構函式所提供語言的描述,請參閱 WordsSegmenter 簡介。 |
屬性
ResolvedLanguage |
取得這個 WordsSegmenter 物件所使用的規則語言。 如果我們使用語言中性規則,則會傳回 「und」 (未決定) 。 |
方法
GetTokenAt(String, UInt32) |
會決定並傳回包含或追蹤所提供文字之指定索引的字幹或字幹。 |
GetTokens(String) |
會決定並傳回所提供文字中的所有單字或字幹。 |
Tokenize(String, UInt32, WordSegmentsTokenizingHandler) |
使用兩個反覆運算器呼叫提供的處理常式,以逐一查看指定索引之前的字組,並將指定的索引追蹤至提供的文字。 |