字符和实体引用
通过字符和实体引用,可以通过引用将信息加入 XML 文档,而不必直接在文档中键入字符。 在下列情况下,这样做很有用:
因为会被解释为标记,字符无法直接输入文档。
因为输入设备的限制,字符无法直接输入文档。
字符无法通过限于单字节字符的处理器可靠地传输。
字符串或文档片断反复出现,并且可以缩写。
为了显示内容,XML 提供了许多语法构造,以“and”符 (&) 开头,以分号 (;) 结尾。
通过字符引用,可以插入通过指向 Unicode 代码点的数字标识的 Unicode 字符。 代码点可以使用十进制或十六进制表示法标识。
- & #value;
用于十进制引用的语法。
- &# xvalue;
用于十六进制引用的语法。
例如,要插入欧元这个很多键盘仍然没有的符号,可以在文档中插入 €
或 €
。
下表为 XML 标记使用的字符列出了五种内置实体。
实体 | 实体引用 | 含义 |
---|---|---|
lt |
< |
<(小于号) |
gt |
> |
>(大于号) |
amp |
& |
&(“and”符) |
apos |
' |
'(撇号或单引号) |
quot |
" |
"(双引号) |
如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。 '
和 "
实体引用在属性值中最常用。
例如,要写 Me&You,请使用 Me&You
。 对于 a<b,请使用 a<b
。 对于 b>c,请使用 b>c
。
还可以定义自己的实体,与 HTML 定义在 HTML 中使用的一组实体非常类似。 &ap
os 不会被识别为 HTML 文件;在转换为 HTML 时必须使用 $#....
。
如果使用的文档类型定义 (DTD) 已定义了实体,可以使用以下语法在文档内容中引用这些实体。
&entityName;