Поделиться через


Категории

База данных символов Юникода определяет количество возможных значений для свойства General Category и обеспечивает сопоставление кодовых точек с конкретными свойствами символов. В таблицах ниже приводятся распознаваемые значения свойства General Category.

IsCategory

Синтаксис

IsCategory ::= Letters | Marks | Numbers | Punctuation | Separators | Symbols | Others

Буквы

Синтаксис

Letters ::= 'L' [ultmo]?

В следующей таблице приведены свойства для букв.

Свойство Описание

L

Все буквы

Lu

Прописные буквы

Ll

Нижний регистр

Lt

Регистр заголовка

Lm

Модификатор

Lo

Другое

Метки

Синтаксис

Marks ::= 'M' [nce]?

В следующей таблице приведены свойства для меток.

Свойство Описание

M

Все метки

Mn

Непробельные символы

Mc

Совмещение пробела

Me

Заключение в кавычки

Числа

Синтаксис

Numbers ::= 'N' [dlo]?

В следующей таблице приведены свойства для чисел.

Свойство Описание

N

Все числа

Nd

Десятичная цифра

Nl

Буква

Нет

Другое

Пунктуация

Синтаксис

Punctuation ::= 'P' [cdseifo]?

В следующей таблице приведены свойства для символов пунктуации.

Свойство Описание

P

Все символы пунктуации

Pc

Соединитель

Pd

Тире

Ps

Открыть

Pe

Закрыть

Pi

Открывающая кавычка (в зависимости от использования поведение может быть аналогичным Ps или Pe)

Pf

Закрывающая кавычка (в зависимости от использования поведение может быть аналогичным Ps или Pe)

Po

Другое

Разделители

Синтаксис

Separators ::= 'Z' [slp]?

В следующей таблице приведены свойства для разделителей.

Свойство Описание

Z

Все разделители

Zs

Пробел

Zl

Строка

Zp

Абзац

Символы

Синтаксис

Symbols ::= 'S' [mcko]?

В следующей таблице приведены свойства для символов.

Свойство Описание

S

Все символы

Sm

Математические

Sc

Валюта

Sk

Модификатор

So

Другое

Другие

Синтаксис

Others ::= 'O' [cfon]?

В следующей таблице приведены свойства для других символов.

Свойство Описание

O

Все остальные

Cc

Элемент управления

Cf

Формат

Co

Символ личного использования

Cn

Неприсвоенный символ

ms256193.note(ru-ru,VS.100).gifПримечание
Свойство Cs сюда не включено.Свойство Cs определяет суррогатные символы, которые не встречаются на уровне абстракции символов, которую используют XML-документы экземпляра.

См. также

Справочник

Регулярные выражения схемы XML
Справочная таблица по регулярным выражениям схемы XML

Основные понятия

Аспекты типов данных