Unicode字段也有collation?
一个常常让人困惑的问题就是,为什么SQL Server 的Unicode 字段(nvarchar/nchar/ntext)也有collation定义呢?Unicode字段不是可以存储多语言吗?比如下面的表定义:
CREATE TABLE tt1
(
c1 int,
c2 nvarchar(10) collate Chinese_PRC_Stroke_CI_AS
)
上门的c2 字段是nvarchar类型,那么加的collate Chinese_PRC_Stroke_CI_AS有啥意义呢。 或许你会问,如果我不加上collate不就行啦. 其实如果没有后面的collate, SQL server 会缺省给你加上数据库的collation. 也就是说nvarchar/nchar等字段一定是有collation的.
那么上面定义的collate有何意义?是否就是指这个c2字段只能存放中文字符呢?不是. Unicode 的collation 的作用是排序规则. 就是说, 这个字段依旧可以存放多国语言,但是你只能指定一种排序规则,如上面的table, 我指定的排序规则就是按照中文排序,即使你存放的是别的语言..
让我们看一看例子:
IF OBJECT_ID ('tt1','U') IS NOT NULL
drop table tt1
go
CREATE TABLE tt1
(
c1 int,
c2 nvarchar(10) collate Chinese_PRC_Stroke_CI_AS
)
go
INSERT tt1 VALUES (1, N'一');
INSERT tt1 VALUES (2, N'二');
INSERT tt1 VALUES (3, N'三');
INSERT tt1 VALUES (4, N'四');
GO
select * from tt1 order by c2
结果如下:
c1 c2
----------- ----------
1 一
2 二
3 三
4 四
(4 row(s) affected)
你可以看到c2列的排序结果不错. 如果我们使用另外一种collation, 那么结果可能是不同的,让我们看看:
IF OBJECT_ID ('tt1','U') IS NOT NULL
drop table tt1
go
CREATE TABLE tt1
(
c1 int,
c2 nvarchar(10) collate latin1_general_cs_as
)
go
INSERT tt1 VALUES (1, N'一');
INSERT tt1 VALUES (2, N'二');
INSERT tt1 VALUES (3, N'三');
INSERT tt1 VALUES (4, N'四');
GO
select * from tt1 order by c2
结果是不一样的, C2列的order by 结果和上面是有差异的:
c1 c2
----------- ----------
1 一
3 三
2 二
4 四
(4 row(s) affected)
Comments
- Anonymous
January 16, 2011
Collation是做BI的同学很头疼的问题,乱码什么的最讨厌了-_-b 期待更多相关文章 - Anonymous
May 31, 2011
Hi,你好,能否帮忙看下这个问题,select 'hit' where N'ab' = N'aޢb' collate Chinese_PRC_CI_AS为什么sql server会无视一些字符呢?这和collation又有什么关系呢?social.msdn.microsoft.com/.../eabcb303-41d1-4bff-bb54-24c574a6d615 - Anonymous
October 09, 2011
The comment has been removed