Um Byte e Multibyte conjuntos de caracteres
O conjunto de caracteres ASCII define os caracteres no intervalo 0x00 – 0x7F.Há uma série de outros conjuntos de caracteres, principalmente Européia, que definem os caracteres dentro do intervalo 0x00 – 0x7F idêntico ao caractere ASCII definido e também definir um conjunto de caracteres estendidos de 0x80 – 0xFF.Assim, um conjunto de caracteres de byte único, de 8 bits (SBCS) é suficiente para representar o caractere ASCII definido, assim como os conjuntos de caracteres para vários idiomas europeus.No entanto, alguns conjuntos de caracteres não-Européia, como, por exemplo, japonês Kanji, incluem muitos mais caracteres do que pode ser representado em um esquema de codificação de byte único e, portanto, requerem o conjunto de caracteres multibyte (MBCS) de codificação.
Observação |
---|
Muitos SBCS rotinas na biblioteca de tempo de execução do Microsoft manipulam multibyte bytes, caracteres e seqüências de caracteres conforme apropriado.Muitos conjuntos de caracteres multibyte definem o conjunto como um subconjunto de caracteres do ASCII.Muitos conjuntos de caracteres multibyte, cada caractere no intervalo 0x00 – 0x7F é idêntico ao caractere que tem o mesmo valor no conjunto de caracteres ASCII.Por exemplo, em ambos ASCII e MBCS as seqüências de caracteres, um byte NULL ('\0') do caractere tem valor 0x00 e indica o caractere nulo de terminação. |
Um conjunto de caracteres multibyte pode conter caracteres de um byte e de dois bytes.Assim, uma seqüência de caracteres multibyte pode conter uma mistura de caracteres de byte único e bite duplo.Um caractere de dois bytes multibyte possui um byte inicial e um byte de seguimento.Em um determinado conjunto de caracteres multibyte, os bytes de cliente potencial se encaixam em um determinado intervalo, como fazem os bytes de trilha.Quando esses intervalos se sobrepõem, pode ser necessário avaliar o contexto específico para determinar se um determinado byte está funcionando como um byte inicial ou um byte de seguimento.