Caractères supplémentaires
Les types de données nchar et nvarchar stockent chaque caractère sous forme d'une valeur 16 bits dans un encodage appelé UCS-2. Cet encodage, défini pour les versions Unicode antérieures à 1996, prend en charge des caractères dans la plage U+0000 à U+FFFF. Les versions plus récentes d'Unicode ont défini d'autres caractères dans la plage U+10000 à U+10FFFF appelés caractères supplémentaires . Ces caractères sont stockés comme des paires de valeurs 16 bits, appelées paires de substitution, dans un encodage UTF-16. Tous les nouveaux classements de niveau _100 prennent en charge le tri linguistique avec les caractères supplémentaires.
Si vous utilisez des caractères supplémentaires, tenez compte des contraintes suivantes :
Les caractères supplémentaires ne peuvent être utilisés dans des opérations de tri et de comparaison que sur les versions de classement 90 ou versions supérieures.
Étant donné que les caractères supplémentaires sont stockés sous la forme de valeurs 16 bits, la fonction LEN() retourne la valeur 2 pour chaque caractère supplémentaire contenu dans la chaîne d'arguments. De même, les fonctions CHARINDEX et PATINDEX interprètent mal l'occurrence des caractères supplémentaires dans les chaînes de caractères.
Les fonctions LEFT, RIGHT, SUBSTRING, STUFF et REVERSE peuvent fractionner toute paire de caractères de substitution et produire des résultats inattendus.
Les caractères supplémentaires ne sont pas utilisables avec les caractères génériques suivants : trait de soulignement (_), pourcentage (%) et signe insertion (^).
Les caractères supplémentaires ne sont pas utilisables dans les métadonnées, telles que les noms d'objets de base de données.
Pour un script Transact-SQL associé à ce scénario, consultez l'exemple Manipulation de chaînes sensible aux caractères supplémentaires. Pour plus d'informations sur les exemples, consultez Considérations relatives à l'installation d'exemples de bases de données et d'exemples de code SQL Server.