Sdílet prostřednictvím


Znakové sady používané písmy

Všechna písma používají znakovou sadu. Znaková sada obsahuje interpunkční znaménka, číslice, velká a malá písmena a všechny ostatní tisknutelné znaky. Každý prvek znakové sady je identifikován číslem.

Většina použitých znakových sad je nadmnožina znakové sady ASCII v USA, která definuje znaky pro 96 číselných hodnot od 32 do 127. Existuje pět hlavních skupin znakových sad:

  • Windows
  • Unicode
  • Výrobce OEM (výrobce původního vybavení)
  • Symbol
  • Specifické pro dodavatele

Znaková sada systému Windows

Znaková sada Systému Windows je nejčastěji používanou znaková sada. Je v podstatě ekvivalentní znakové sadě ANSI. Prázdný znak je první znak v znakové sadě Windows. Má šestnáctkovou hodnotu 0x20 (desítkové číslo 32). Poslední znak v znakové sadě Windows má šestnáctkovou hodnotu 0xFF (desítkové číslo 255).

Mnoho písem určuje výchozí znak. Pokaždé, když se pro znak, který není v písmu, vytvoří požadavek, systém tento výchozí znak. Mnoho písem používajících znakovou sadu Windows určuje tečku (.) jako výchozí znak. Písma TrueType a OpenType obvykle jako výchozí znak používají otevřené pole.

Písma používají znak zalomení označovaný jako čtyřúhelník k oddělení slov a zarovnání textu do bloku. Většina písem používajících znakovou sadu Windows určuje, že prázdný znak bude sloužit jako znak konce.

Znaková sada Unicode

Znaková sada systému Windows používá k reprezentaci každého znaku 8 bitů; proto maximální počet znaků, které lze vyjádřit pomocí 8 bitů, je 256 (2^8). To obvykle stačí pro západní jazyky, včetně diacritických známek používaných ve francouzštině, němčině, španělštině a dalších jazycích. Východní jazyky však používají tisíce samostatných znaků, které nelze zakódovat pomocí schématu kódování s jedním bajtem. Při šíření počítačového obchodování byly vyvinuta dvoubabajtů schémata kódování tak, aby znaky mohly být reprezentovány v 8bitových, 16bitových, 24bitových nebo 32bitových sekvencích. To vyžaduje složité předávací algoritmy; i tak by použití různých sad kódu mohlo přinést zcela odlišné výsledky na dvou různých počítačích.

Abychom vyřešili problém s více schématy kódování, byl vyvinut standard Unicode pro reprezentaci dat. 16bitové schéma kódování znaků, Unicode může představovat 65 536 (2^16) znaků, což stačí k zahrnutí všech jazyků v počítačovém obchodování dnes, stejně jako interpunkční znaménka, matematické symboly a prostor pro rozšíření. Unicode vytvoří jedinečný kód pro každý znak, aby se zajistilo, že překlad znaků je vždy přesný.

Znaková sada OEM

Znaková sada OEM se obvykle používá v celoobrazovkových MS-DOS relacích pro zobrazení obrazovky. Znaky 32 až 127 jsou obvykle stejné v OEM, ASCII a Windows znakové sady. Ostatní znaky v znakové sadě OEM (0 až 31 a 128 až 255) odpovídají znakům, které se dají zobrazit v relaci MS-DOS na celé obrazovce. Tyto znaky se obecně liší od znaků systému Windows.

Znaková sada symbolů

Znaková sada symbolů obsahuje speciální znaky, které se obvykle používají k reprezentaci matematických a vědeckých vzorců.

Znakové sady specifické pro dodavatele

Mnoho tiskáren a dalších výstupních zařízení poskytuje písma založená na znakových sadách, které se liší od sad Windows a OEM, například sada znaků EBCDIC (Extended Binary Coded Decimal Interchange Code). Chcete-li použít jednu z těchto znakových sad, ovladač tiskárny přeloží z znakové sady systému Windows na sadu znaků specifických pro dodavatele.