一般檔案結構描述的字碼頁規格
概觀
Code Page屬性中的值是用來建立編碼物件,該物件會在一般檔案檔的反組解碼和元件期間使用。 此編碼物件可讓一般檔案剖析器將輸入一般檔案檔的原生編碼轉換成 Microsoft BizTalk Server內部使用的標準化 UTF-8 編碼。 這個編碼物件也允許一般檔案序列化程式將內部 UTF-8 編碼轉換回一般檔案文件的原生編碼。
[字碼頁] 屬性的設定在決定一般檔案商務檔所使用的字元編碼配置方面扮演重要但並非獨佔的角色。 您必須考慮由一般檔案解譯器解譯輸入一般檔案訊息的方式,以及一般檔案組合器將字元編碼為轉譯至一般檔案格式之輸出訊息的方式。
字元編碼
在決定如何處理指定執行個體訊息之字元編碼的方式時,有多個因素扮演重要的角色,如下所示:
當解譯一般檔案執行個體訊息時,會使用下列演算法來決定並保留編碼資訊:
如果已設定 Message 本文元件中的 Charset ,則會使用其值。
否則,如果信封 (或檔) 架構使用 Code Page 屬性指定字碼頁 ,則會使用其值。
或者,若位元順序標記存在,則會使用它的值。
或者,使用 UTF-8。
當組合一般檔案執行個體訊息時,會使用下列演算法來決定供解碼使用的字元集:
如果已設定 XMLNorm.TargetCharset 訊息內容屬性,則會使用其值。
否則,如果 TargetCharset 組合器 (設定設計階段) 屬性,則會使用其值。
否則,如果信封 (或檔) 架構使用 Code Page 屬性指定字碼頁 ,則會使用其值。
否則,如果已設定 SourceCharset 訊息內容屬性,則會使用其值。
或者,使用 UTF-8。
另請參閱
在UI 指引和開發人員 API 命名空間參考中建立一般檔案訊息架構和字碼頁 (一般檔案架構) 節點屬性時的考慮