类别
Unicode 字符数据库为 General Category 属性指定了许多可能值,并且提供从代码数据点到特定字符属性的映射。下表指定 General Category 属性的可以识别的值。
IsCategory
语法
IsCategory ::= Letters | Marks | Numbers | Punctuation | Separators | Symbols | Others
字母
语法
Letters ::= 'L' [ultmo]?
下表显示字母的属性。
属性 |
说明 |
---|---|
L |
所有字母 |
Lu |
大写 |
Ll |
小写 |
Lt |
词首字母大写 |
Lm |
修饰符 |
Lo |
其他 |
标记
语法
Marks ::= 'M' [nce]?
下表显示标记的属性。
属性 |
说明 |
---|---|
M |
所有标记 |
Mn |
无间距 |
Mc |
空格合并 |
Me |
封闭 |
数字
语法
Numbers ::= 'N' [dlo]?
下表显示数字的属性。
属性 |
说明 |
---|---|
N |
所有数字 |
Nd |
十进制数字 |
Nl |
字母 |
否 |
其他 |
标点
语法
Punctuation ::= 'P' [cdseifo]?
下表显示标点的属性。
属性 |
说明 |
---|---|
P |
所有标点 |
Pc |
连接符 |
Pd |
短划线 |
Ps |
打开 |
Pe |
关闭 |
Pi |
左引号(根据具体使用情况,作用可能像 Ps 或 Pe) |
Pf |
右引号(根据具体使用情况,作用可能像 Ps 或 Pe) |
Po |
其他 |
分隔符
语法
Separators ::= 'Z' [slp]?
下表显示分隔符的属性。
属性 |
说明 |
---|---|
Z |
所有分隔符 |
Zs |
空格 |
Zl |
行 |
Zp |
Paragraph |
符号
语法
Symbols ::= 'S' [mcko]?
下表显示符号的属性。
属性 |
说明 |
---|---|
S |
所有符号 |
Sm |
数学 |
Sc |
货币 |
Sk |
修饰符 |
So |
其他 |
其他
语法
Others ::= 'O' [cfon]?
下表显示其他类别的属性。
属性 |
说明 |
---|---|
O |
所有其他属性 |
Cc |
控制 |
Cf |
格式 |
Co |
专用 |
Cn |
未分配 |
备注
此处未包括 Cs 属性。Cs 属性标识代理项字符,这些代理项字符在 XML 实例文档使用的字符抽象级别不出现。