Suporte a Unicode para pares substitutos e seqüências de caractere sem espaçamento
O padrão Unicode define um emparelhar substituto sistema autônomo uma representação de caracteres codificadas para um único caractere abstrata que consiste em uma sequência de duas unidades de código.O primeiro valor do emparelhar substituto é o substituto alto, um valor de código de 16 bit no intervalo de u+D800 a U+DBFF.O segundo valor do emparelhar é o substituto baixo, no intervalo de u+DC00 a U+DFFF.
O padrão Unicode define um caractere sem espaçamento sequência sistema autônomo uma combinação de um caractere base e um ou mais caractere sem espaçamento sistema autônomo.Um emparelhar substituto pode representar um caractere base ou um caractere sem espaçamento.Para obter mais informações sobre pares substitutos e combinar seqüências de caractere, consulte The Unicode Standard no residência do Unicode.
O ponto-chave lembrar é que os pares substitutos representam caracteres únicos de 32 bit.Você não pode presumir que um valor codificação Unicode de 16 bit mapeia para exatamente um caractere.Usando pares substitutos, um sistema de codificação Unicode de 16 bit pode lidar com mais de um milhão de pontos de código para os caracteres que serão atribuídos pelo padrão Unicode.
O .NET estrutura oferece suporte a elementos de texto.Um elemento de texto é uma unidade de texto que é exibido sistema autônomo um único caractere chamado um grapheme.Um elemento de texto pode ser um caractere base, um emparelhar substituto ou um caractere sem espaçamento sequência.The StringInfo classe fornece métodos que permitem que seu aplicativo para dividir uma cadeia de caracteres em seus elementos de texto e iterar por meio dos elementos de texto. Para obter um exemplo de como usar o StringInfo classe, consulte Seqüência de caracteres de indexação.