平面文件架构的代码页规范
概述
Code Page 属性中的值用于创建在平面文件文档的反汇编和程序集期间使用的编码对象。 此编码对象允许平面文件分析程序将入站平面文件文档的本机编码转换为 Microsoft BizTalk Server内部使用的规范化 UTF-8 编码。 使用此编码对象,平面文件序列化程序还可以将内部 UTF-8 编码重新转换为平面文件文档的本机编码。
“代码页”属性的设置在确定平面文件业务文档使用的字符编码方案方面发挥着重要但并非排他性的作用。 您必须考虑平面文件拆装器如何解释入站平面文件消息,以及在将出站消息转换为平面文件格式时平面文件组装器将如何对字符进行编码。
字符编码
在确定如何处理指定实例消息的字符编码时,有多种会影响处理方式的因素,如下所示:
在拆装平面文件实例消息时,使用以下算法来确定和保留编码信息:
如果设置了消息正文部件中的 字符集 ,则使用其值。
否则,如果信封 (或文档) 架构使用 Code Page 属性指定代码页 ,则使用其值。
否则,如果存在字节顺序标记,则使用该标记的值。
否则,假定为 UTF-8。
在组合平面文件实例消息时,使用以下算法来确定要用于解码的字符集:
如果设置了 XMLNorm.TargetCharset 消息上下文属性,则使用其值。
否则,如果设置了 TargetCharset 汇编程序 (设计时) 属性,则使用其值。
否则,如果信封 (或文档) 架构使用 Code Page 属性指定代码页 ,则使用其值。
否则,如果设置了 SourceCharset 消息上下文属性,则使用其值。
否则,使用 UTF-8。
另请参阅
在 UI 指南和开发人员 API 命名空间参考中创建平面文件消息架构和代码页 (平面文件架构) 节点属性 时的注意事项