Наборы символов, используемые шрифтами
Все шрифты используют набор символов. Набор символов содержит знаки препинания, числовые знаки, прописные и строчные буквы, а также все остальные печатные символы. Каждый элемент набора символов определяется числом.
Большинство используемых наборов символов — это надмножества набора символов ASCII в США, который определяет символы для 96 числовых значений от 32 до 127. Существует пять основных групп наборов символов:
- Виндоус
- Юникод
- OEM (изготовитель исходного оборудования)
- Символ
- Конкретный поставщик
Набор символов Windows
Набор символов Windows является наиболее часто используемым набором символов. По сути, это эквивалентно набору символов ANSI. Пустой символ — это первый символ в наборе символов Windows. Он имеет шестнадцатеричное значение 0x20 (десятичное значение 32). Последний символ в наборе символов Windows имеет шестнадцатеричное значение 0xFF (десятичное значение 255).
Многие шрифты указывают символ по умолчанию. Всякий раз, когда запрос выполняется для символа, который не находится в шрифте, система предоставляет этот символ по умолчанию. Многие шрифты, использующие набор символов Windows, указывают период (.) в качестве символа по умолчанию. Шрифты TrueType и OpenType обычно используют открытое поле в качестве символа по умолчанию.
Шрифты используют символ разрыва, называемый квадратом, для разделения слов и оправдания текста. Большинство шрифтов, использующих набор символов Windows, указывают, что пустой символ будет служить символом разрыва.
Набор символов Юникода
Набор символов Windows использует 8 битов для представления каждого символа; Таким образом, максимальное число символов, которые можно выразить с помощью 8 битов, равно 256 (2^8). Обычно это достаточно для западных языков, включая диакритические знаки, используемые на французском, немецком, испанском и других языках. Однако восточные языки используют тысячи отдельных символов, которые не могут быть закодированы с помощью однобайтовой схемы кодирования. С распространением компьютерной коммерции были разработаны схемы двойного байтового кодирования, чтобы символы могли быть представлены в 8-разрядной, 16-разрядной, 24-разрядной или 32-разрядной последовательности. Для этого требуются сложные алгоритмы передачи; даже поэтому использование разных наборов кода может дать совершенно разные результаты на двух разных компьютерах.
Для решения проблемы с несколькими схемами программирования был разработан стандарт Юникода для представления данных. 16-разрядная схема программирования символов Юникод может представлять 65 536 символов (2^16), что достаточно для включения всех языков в компьютерной коммерции сегодня, а также знаки препинания, математические символы и пространство для расширения. Юникод устанавливает уникальный код для каждого символа, чтобы гарантировать, что перевод символов всегда является точным.
Набор символов OEM
Набор символов OEM обычно используется в полноэкранных MS-DOS сеансах для отображения экрана. Символы 32–127 обычно одинаковы в наборах символов OEM, ASCII и Windows. Другие символы в наборе символов OEM (от 0 до 31 и 128–255) соответствуют символам, которые можно отобразить в полноэкранном MS-DOS сеансе. Эти символы обычно отличаются от символов Windows.
Набор символов
Набор символов содержит специальные символы, которые обычно используются для представления математических и научных формул.
Наборы символов для конкретного поставщика
Многие принтеры и другие выходные устройства предоставляют шрифты на основе наборов символов, которые отличаются от наборов windows и OEM, например, набор символов расширенного двоичного закодированного десятичного обмена (EBCDIC). Чтобы использовать один из этих наборов символов, драйвер принтера преобразуется из символа Windows, заданного в набор символов для конкретного поставщика.