类别

Unicode 字符数据库为 General Category 属性指定了许多可能值,并且提供从代码数据点到特定字符属性的映射。下表指定 General Category 属性的可以识别的值。

IsCategory

语法

IsCategory ::= Letters | Marks | Numbers | Punctuation | Separators | Symbols | Others

字母

语法

Letters ::= 'L' [ultmo]?

下表显示字母的属性。

属性

说明

L

所有字母

Lu

大写

Ll

小写

Lt

词首字母大写

Lm

修饰符

Lo

其他

标记

语法

Marks ::= 'M' [nce]?

下表显示标记的属性。

属性

说明

M

所有标记

Mn

无间距

Mc

空格合并

Me

封闭

数字

语法

Numbers ::= 'N' [dlo]?

下表显示数字的属性。

属性

说明

N

所有数字

Nd

十进制数字

Nl

字母

其他

标点

语法

Punctuation ::= 'P' [cdseifo]?

下表显示标点的属性。

属性

说明

P

所有标点

Pc

连接符

Pd

短划线

Ps

打开

Pe

关闭

Pi

左引号(根据具体使用情况,作用可能像 PsPe

Pf

右引号(根据具体使用情况,作用可能像 PsPe

Po

其他

分隔符

语法

Separators ::= 'Z' [slp]?

下表显示分隔符的属性。

属性

说明

Z

所有分隔符

Zs

空格

Zl

Zp

Paragraph

符号

语法

Symbols ::= 'S' [mcko]?

下表显示符号的属性。

属性

说明

S

所有符号

Sm

数学

Sc

货币

Sk

修饰符

So

其他

其他

语法

Others ::= 'O' [cfon]?

下表显示其他类别的属性。

属性

说明

O

所有其他属性

Cc

控制

Cf

格式

Co

专用

Cn

未分配

备注

此处未包括 Cs 属性。Cs 属性标识代理项字符,这些代理项字符在 XML 实例文档使用的字符抽象级别不出现。

请参阅

参考

XML 架构正则表达式

XML 架构正则表达式参考图表

概念

数据类型方面