Compartilhar via


Conjuntos de caracteres e Unicode

O Microsoft Windows oferece suporte para as várias linguagens escritas diferentes do marketplace internacional por meio de Unicode e conjuntos de caracteres tradicionais.

Unicode é um padrão de codificação de caracteres mundial que fornece um número exclusivo para representar cada caractere usado na computação moderna, incluindo símbolos técnicos e caracteres especiais usados na publicação. O Unicode é exigido por padrões modernos, como XML e ECMAScript (JavaScript), e é o mecanismo oficial para implementar o ISO/IEC 10646. Ele é compatível com muitos sistemas operacionais, todos os navegadores modernos e muitos outros produtos. Os novos aplicativos do Windows devem usar o Unicode para evitar inconsistências de páginas de código variadas e para ajudar a simplificar a localização.

Conjuntos de caracteres tradicionais são os padrões de codificação de caracteres anteriores, como páginas de código do Windows que usam valores de código de 8 bits ou combinações de valores de 8 bits para representar os caracteres usados em uma linguagem específica ou região geográfica.

Essa visão geral descreve as funções do conjunto de caracteres e explica como usá-las em seus aplicativos.

tratando IDNs (nomes de domínio internacionalizados)

usando a normalização Unicode para representar cadeias de caracteres