Surrogate 字組和結合字元序列的 Unicode 支援
Unicode Standard 將 Surrogate 字組定義為單一抽象字元 (由兩個字碼單位組成) 的編碼字元表示。Surrogate 字組的第一個值為高 Surrogate 且含有 16 位元字碼值,範圍從 U+D800 到 U+DBFF。Surrogate 字組的第二個值為低 Surrogate,它所包含的值範圍為 U+DC00 到 U+DFFF。
Unicode Standard 將結合字元序列定義為基底字元和一或多個結合字元的組合。Surrogate 字組可以表示基底字元或組合字元如需 Surrogate 字組和結合字元序列的詳細資訊,請參閱<Unicode Standard>,網址為 www.unicode.org。
請注意,Surrogate 字組表示 32 位元的單一字元,而您無法假設某個 16 位元的 Unicode 編碼值會對應到某個字元。使用 Surrogate 字組時,16 位元的 Unicode 編碼系統可提供額外的一百萬個字碼指標,Unicode Standard 可指派字元給這些指標。
.NET Framework 支援文字項目。文字項目是顯示為單一字元的文字單位,又稱為字母。文字項目可以是基底字元、Surrogate 字組或組合字元序列。StringInfo 類別提供讓您將字元分隔為文字項目以及逐一查看文字項目的方法。例如,StringInfo.GetNextTextElement 方法可以讓您取出 Surrogate 字組成為文字項目。如需使用 StringInfo 類別的範例,請參閱字串索引。
請參閱
參考
概念
.NET Framework 中的 Unicode
字串索引