Категории
База данных символов Юникода определяет количество возможных значений для свойства General Category и обеспечивает сопоставление кодовых точек с конкретными свойствами символов. В таблицах ниже приводятся распознаваемые значения свойства General Category.
IsCategory
Синтаксис
IsCategory ::= Letters | Marks | Numbers | Punctuation | Separators | Symbols | Others
Буквы
Синтаксис
Letters ::= 'L' [ultmo]?
В следующей таблице приведены свойства для букв.
Свойство | Описание |
---|---|
L |
Все буквы |
Lu |
Прописные буквы |
Ll |
Нижний регистр |
Lt |
Регистр заголовка |
Lm |
Модификатор |
Lo |
Другое |
Метки
Синтаксис
Marks ::= 'M' [nce]?
В следующей таблице приведены свойства для меток.
Свойство | Описание |
---|---|
M |
Все метки |
Mn |
Непробельные символы |
Mc |
Совмещение пробела |
Me |
Заключение в кавычки |
Числа
Синтаксис
Numbers ::= 'N' [dlo]?
В следующей таблице приведены свойства для чисел.
Свойство | Описание |
---|---|
N |
Все числа |
Nd |
Десятичная цифра |
Nl |
Буква |
Нет |
Другое |
Пунктуация
Синтаксис
Punctuation ::= 'P' [cdseifo]?
В следующей таблице приведены свойства для символов пунктуации.
Свойство | Описание |
---|---|
P |
Все символы пунктуации |
Pc |
Соединитель |
Pd |
Тире |
Ps |
Открыть |
Pe |
Закрыть |
Pi |
Открывающая кавычка (в зависимости от использования поведение может быть аналогичным Ps или Pe) |
Pf |
Закрывающая кавычка (в зависимости от использования поведение может быть аналогичным Ps или Pe) |
Po |
Другое |
Разделители
Синтаксис
Separators ::= 'Z' [slp]?
В следующей таблице приведены свойства для разделителей.
Свойство | Описание |
---|---|
Z |
Все разделители |
Zs |
Пробел |
Zl |
Строка |
Zp |
Абзац |
Символы
Синтаксис
Symbols ::= 'S' [mcko]?
В следующей таблице приведены свойства для символов.
Свойство | Описание |
---|---|
S |
Все символы |
Sm |
Математические |
Sc |
Валюта |
Sk |
Модификатор |
So |
Другое |
Другие
Синтаксис
Others ::= 'O' [cfon]?
В следующей таблице приведены свойства для других символов.
Свойство | Описание |
---|---|
O |
Все остальные |
Cc |
Элемент управления |
Cf |
Формат |
Co |
Символ личного использования |
Cn |
Неприсвоенный символ |
![]() |
---|
Свойство Cs сюда не включено.Свойство Cs определяет суррогатные символы, которые не встречаются на уровне абстракции символов, которую используют XML-документы экземпляра. |
См. также
Справочник
Регулярные выражения схемы XML
Справочная таблица по регулярным выражениям схемы XML