字符和实体引用

通过字符和实体引用,可以通过引用将信息加入 XML 文档,而不必直接在文档中键入字符。 在下列情况下,这样做很有用:

  • 因为会被解释为标记,字符无法直接输入文档。

  • 因为输入设备的限制,字符无法直接输入文档。

  • 字符无法通过限于单字节字符的处理器可靠地传输。

  • 字符串或文档片断反复出现,并且可以缩写。

为了显示内容,XML 提供了许多语法构造,以“and”符 (&) 开头,以分号 (;) 结尾。

通过字符引用,可以插入通过指向 Unicode 代码点的数字标识的 Unicode 字符。 代码点可以使用十进制或十六进制表示法标识。

  • & #value;
    用于十进制引用的语法。
  • &# xvalue;
    用于十六进制引用的语法。

例如,要插入欧元这个很多键盘仍然没有的符号,可以在文档中插入 €€

下表为 XML 标记使用的字符列出了五种内置实体。

实体 实体引用 含义

lt

<

<(小于号)

gt

&gt;

>(大于号)

amp

&amp;

&(“and”符)

apos

&apos;

'(撇号或单引号)

quot

&quot;

"(双引号)

如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。 &apos;&quot; 实体引用在属性值中最常用。

例如,要写 Me&You,请使用 Me&amp;You。 对于 a<b,请使用 a&lt;b。 对于 b>c,请使用 b&gt;c

还可以定义自己的实体,与 HTML 定义在 HTML 中使用的一组实体非常类似。 &apos 不会被识别为 HTML 文件;在转换为 HTML 时必须使用 $#....

如果使用的文档类型定义 (DTD) 已定义了实体,可以使用以下语法在文档内容中引用这些实体。

&entityName;