Sdílet prostřednictvím


Jednobajtové a vícebajtové znakové sady

Znaková sada ASCII znaky definuje v rozsahu – 0x7F.Existuje několik dalších znakových sad, především Evropské definujících znaků v rámci rozsahu – 0x7F na znak ASCII přesně nastavit a také definovat rozšířené znakové sady z 0x80 – 0xFF.Tedy sady 8 bit, byte jeden znak (SBCS) je dostatečné znak ASCII, nastavte také znakové sady pro mnoho evropských jazyků.Však některé pro Evropské znakové sady, například japonské Kanji zahrnout mnoho více znaků, než může být znázorněno schéma kódování jednoho bajtu a proto vyžadují vícebajtové znakové sady (MBCS) kódování.

[!POZNÁMKA]

Mnoho SBCS rutinami při spuštění knihovny Microsoft zpracovat vícebajtové bajtů, znaky a podle potřeby řetězce.Mnoho vícebajtové znakové sady definovat znak ASCII nastavit jako dílčí.V mnoha vícebajtových znakových sadách je každý znak v rozsahu 0x00 – 0x7F stejný jako znak, který má stejnou hodnotu ve znakové sadě ASCII.Například v obou ASCII a MBCS řetězce znaků, jeden bajt NULL znak (\0) má hodnotu 0x00 a označuje ukončujícím znakem null.

Vícebajtové znakové sady se může skládat z jednobajtových a dvoubajtových znaků.Řetězec vícebajtových znaků tedy může obsahovat kombinaci jednobajtových a dvoubajtových znaků.Dvoubajtový vícebajtových znaků má vedoucí bajt a revizní bajt.V konkrétní multibajtové znakové sadě spadají úvodní bajty do určitého rozsahu, stejně jako druhé bajty.Když tyto rozsahy překrývají, může být nezbytné vyhodnotit určitému kontextu určit, zda daný bajt funguje jako vedoucí bajt nebo trail bajt.

Viz také

Referenční dokumentace

Internacionalizace

Spuštění rutiny podle kategorie