Поделиться через


Наборы символов, используемые шрифтами

Все шрифты используют набор символов. Набор символов содержит знаки препинания, числовые знаки, прописные и строчные буквы, а также все остальные печатные символы. Каждый элемент набора символов определяется числом.

Большинство используемых наборов символов — это надмножества набора символов ASCII в США, который определяет символы для 96 числовых значений от 32 до 127. Существует пять основных групп наборов символов:

  • Виндоус
  • Юникод
  • OEM (изготовитель исходного оборудования)
  • Символ
  • Конкретный поставщик

Набор символов Windows

Набор символов Windows является наиболее часто используемым набором символов. По сути, это эквивалентно набору символов ANSI. Пустой символ — это первый символ в наборе символов Windows. Он имеет шестнадцатеричное значение 0x20 (десятичное значение 32). Последний символ в наборе символов Windows имеет шестнадцатеричное значение 0xFF (десятичное значение 255).

Многие шрифты указывают символ по умолчанию. Всякий раз, когда запрос выполняется для символа, который не находится в шрифте, система предоставляет этот символ по умолчанию. Многие шрифты, использующие набор символов Windows, указывают период (.) в качестве символа по умолчанию. Шрифты TrueType и OpenType обычно используют открытое поле в качестве символа по умолчанию.

Шрифты используют символ разрыва, называемый квадратом, для разделения слов и оправдания текста. Большинство шрифтов, использующих набор символов Windows, указывают, что пустой символ будет служить символом разрыва.

Набор символов Юникода

Набор символов Windows использует 8 битов для представления каждого символа; Таким образом, максимальное число символов, которые можно выразить с помощью 8 битов, равно 256 (2^8). Обычно это достаточно для западных языков, включая диакритические знаки, используемые на французском, немецком, испанском и других языках. Однако восточные языки используют тысячи отдельных символов, которые не могут быть закодированы с помощью однобайтовой схемы кодирования. С распространением компьютерной коммерции были разработаны схемы двойного байтового кодирования, чтобы символы могли быть представлены в 8-разрядной, 16-разрядной, 24-разрядной или 32-разрядной последовательности. Для этого требуются сложные алгоритмы передачи; даже поэтому использование разных наборов кода может дать совершенно разные результаты на двух разных компьютерах.

Для решения проблемы с несколькими схемами программирования был разработан стандарт Юникода для представления данных. 16-разрядная схема программирования символов Юникод может представлять 65 536 символов (2^16), что достаточно для включения всех языков в компьютерной коммерции сегодня, а также знаки препинания, математические символы и пространство для расширения. Юникод устанавливает уникальный код для каждого символа, чтобы гарантировать, что перевод символов всегда является точным.

Набор символов OEM

Набор символов OEM обычно используется в полноэкранных MS-DOS сеансах для отображения экрана. Символы 32–127 обычно одинаковы в наборах символов OEM, ASCII и Windows. Другие символы в наборе символов OEM (от 0 до 31 и 128–255) соответствуют символам, которые можно отобразить в полноэкранном MS-DOS сеансе. Эти символы обычно отличаются от символов Windows.

Набор символов

Набор символов содержит специальные символы, которые обычно используются для представления математических и научных формул.

Наборы символов для конкретного поставщика

Многие принтеры и другие выходные устройства предоставляют шрифты на основе наборов символов, которые отличаются от наборов windows и OEM, например, набор символов расширенного двоичного закодированного десятичного обмена (EBCDIC). Чтобы использовать один из этих наборов символов, драйвер принтера преобразуется из символа Windows, заданного в набор символов для конкретного поставщика.