.NET Framework 中的 Unicode
.NET Framework 使用 Unicode UTF-16 (Unicode 轉換格式,16 位元編碼方式格式) 來表示字元。在某些情況下,.NET Framework 在內部使用 UTF-8。
Unicode Standard 是字元和文字的通用字元編碼方式配置。它指定唯一的數值 (稱為字碼指標) 和為全球撰寫語言中使用的每個字元命名。例如,字元 "A" 是由字碼指標 "U+0041" 和名稱 "LATIN CAPITAL LETTER A" 來表示。可使用的數值超過 65,000 字元,而且仍有可支援一百萬個字元的空間。如需詳細資訊,請參閱<Unicode Standard>,網址為 www.unicode.org。
在過去,不同的文化特性的各種語言需求會強迫應用程式使用不同的編碼方式,在內部表示資料。這些不同的編碼方式配置會迫使開發人員替作業系統和應用程式建立零散的程式碼基底,例如歐洲語系的單位元組版本、亞洲語系的雙位元組版本和中東語系的雙向版本。這個分散片段會使得在文化特性之間分享資料變得很困難,甚至會使得開發世界性和支援多語系使用者介面應用程式更為困難。
Unicode 資料編碼方式配置可以建立世界性的應用程式開發,因為它能讓所有國際字元在單一編碼方式中表示。應用程式開發人員不需再追蹤用來產生特定語言字元的編碼方式配置,而且資料不會被毀損便可在各國系統之間共用。
請參閱
參考
System.Text Namespace
StringInfo Class