游标脚本性能问题解决与分析 (1) - Cursor Performance Analysis
第一部分:游标类型对性能影响的实例引出
下面的两个游标脚本分别创建并执行了dynamic和fast forward only两种类型的游标:
不理想的游标类型:( dynamic游标) |
理想的游标类型( fast forward only游标) |
declare @p1 int set @p1=NULL declare @p2 int set @p2=0 declare @p5 int set @p5=4098 declare @p6 int set @p6=8193 declare @p7 int set @p7=0 exec sp_cursorprepexec @p1 output,@p2 output,N'@P1 varchar(30),@P2 varchar(15)', N' SELECT T1.CONFLICT_ID FROM dbo.S_AUDIT_ITEM T1 LEFT OUTER JOIN dbo.S_USER T2 ON T1.USER_ID = T2.PAR_ROW_ID WHERE ((T1.BC_BASE_TBL = @P1) AND (T1.RECORD_ID = @P2)) ORDER BY T1.OPERATION_DT DESC OPTION (FAST 40) ', @p5 output,@p6 output,@p7 output,'1-10350J','S_PARTY' print 'fetch' exec sp_cursorfetch @p2,2,4,1 exec sp_cursorclose @p2 |
declare @p1 int set @p1=NULL declare @p2 int set @p2=0 declare @p5 int set @p5=4112 declare @p6 int set @p6=8193 declare @p7 int set @p7=0 exec sp_cursorprepexec @p1 output,@p2 output,N'@P1 varchar(30),@P2 varchar(15)', N' SELECT T1.CONFLICT_ID FROM dbo.S_AUDIT_ITEM T1 LEFT OUTER JOIN dbo.S_USER T2 ON T1.USER_ID = T2.PAR_ROW_ID WHERE ((T1.BC_BASE_TBL = @P1) AND (T1.RECORD_ID = @P2)) ORDER BY T1.OPERATION_DT DESC OPTION (FAST 40) ', @p5 output,@p6 output,@p7 output,'S_SRV_REQ','1-WUQTM6' select @p1, @p2, @p5, @p6, @p7 print '2' exec sp_cursorfetch @p2,2,1,1 print '3' exec sp_cursorclose @p2 |
注:脚本中用到的和游标有关的存储过程,请参考:https://jtds.sourceforge.net/apiCursors.html#_sp_cursorprepexec
一,如何解读游标的类型
sp_cursorprepexec [ @handle = ] statement_handle OUTPUT,
[ @cursor = ] cursor_handle OUTPUT,
[ @paramdef = ] N'parameter_name data_type, [, ...n]'
[ @stmt = ] N'stmt',
[, [ @scrollopt = ] scroll_options OUTPUT]
[, [ @ccopt = ] concurrency_options OUTPUT]
[, [ @rowcount = ] rowcount OUTPUT]
@scrollopt
Value |
Description |
0x0001 |
Keyset-driven cursor. |
0x0002 |
Dynamic cursor. |
0x0004 |
Forward-only cursor. |
0x0008 |
Static cursor. |
0x0010 |
Fast forward-only cursor. |
0x1000 |
Parameterized query. |
0x2000 |
Auto fetch. |
0x4000 |
Auto close. |
0x8000 |
Check acceptable types. |
0x10000 |
Keyset-driven acceptable. |
0x20000 |
Dynamic acceptable. |
0x40000 |
Forward-only acceptable. |
0x80000 |
Static acceptable. |
0x100000 |
Fast forward-only acceptable. |
@ccopt
Value |
Description |
0x0001 |
Read-only. |
0x0002 |
Scroll locks. |
0x0004 |
Optimistic. Checks timestamps and, when not available, values. |
0x0008 |
Optimistic. Checks values (non-text, non-image). |
0x2000 |
Open on any SQL. |
0x4000 |
Update keyset in place. |
0x10000 |
Read-only acceptable. |
0x20000 |
Locks acceptable. |
0x40000 |
Optimistic acceptable. |
@p5=4098 转成16进制就是1002,对应的游标类型为Parameterized query + Dynamic cursor
@p5=4112 转成16进制就是1010,对应的游标类型为Parameterized query + Fast forward-only cursor
问题的现象是,左边的游标类型下,该脚本执行时间远大于右边的游标类型。
二,如何比较两个不同执行计划的优劣
在继续以下内容之前,这里要介绍一些查看和比较语句执行计划的知识。通常情况下,我们从management studio中输出图形界面的执行计划进行直观的比较,查看每个表用的访问方式,使用index还是table scan,使用了哪个index,表和表之间使用的join 方式有什么不一样。但是如果是一个复杂的语句,在不同的数据库上使用了不同的执行计划,对于同样表的访问,使用了不同的index,如何比较哪种执行计划更加优化呢?比较整个语句的执行时间是一种方法,但是这个比较的结果并不准确。语句的执行时间很容易受到其他外在因素的影响:
1. 不同机器上CPU,memory和disk的性能会影响执行时间。
2. 测试的时候有没有其他人在使用同样的数据造成阻塞
3. 其他人堆数据库的使用占用了系统资源
以上这些原因都有可能影响的语句的执行时间,从而影响到我们对语句性能结果的比较。因此我们不能把语句的执行时间作为衡量语句性能的标准。
这里介绍一种比较语句cost的方法。我们对于语句cost的衡量,主要是通过比对语句总的logical reads.
我们可以通过在management studio里的query window 执行”set statistics io on” ,在当前窗口中对所有执行的语句输出信息:
set statistics io on
select * from dbo.test_TicketFact
set statistics io on
执行语句两次,以消除physical reads和read-ahead reads的影响。
输出的结果如下:
(320 row(s) affected)
Table 'test_TicketFact'. Scan count 1, logical reads 3, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
这里打印出来了语句中访问过的table的访问次数,总共的logical reads,physical reads等信息
这里我们需要关注的是logic reads的值,这个值实际上决定了对于IO和DISK以及内存的消耗。当语句是第一次执行,我们会看到physical reads的数字,以,而当语句第二次执行的时候,这些数据已经被读到memory里面了,因此我们会看到physical read和read-ahead reads都变为0,而logical reads的值就变成了语句所有使用的data的量。
为什么logic reads是我们需要关注的值呢?因为logic reads决定了语句要访问数据的量。如果我们的系统瓶颈在IO上,一旦语句需要访问的数据从内存里面清除,这个语句原本所有的logic reads会全部转为physical reads.因此那些大量使用logic reads就是可能导致大量physical reads的元凶。如果我们的bottleneck是CPU,这些做大量logical reads的语句同样有可能导致大量的memory 读,而读memory是需要消耗CPU资源的。因此,无论是CPU,memory还是DISK的瓶颈,那些做大量logical reads的语句都非常可能是造成问题的原因。
由以上内容,我们可以得出结论,语句的性能好坏,取决与这个语句做了多少logical reads.因此,如果同样的语句,使用了不同的执行计划,那么总的logical reads低的那个执行计划就是相对优化的。
三,分析本案例中两种游标的执行计划
现在我们回到需要研究的脚本,在这里,语句是一样的,不同的只是游标的类型。不同的执行时间说明很可能这个语句使用了不同的执行计划。现在问题变成了,同样语句使用了不同的执行计划,得到了不同的执行时间。我们首先从”set statistics io on” 的结果入手:
1.左边使用dynamic游标有大量的逻辑读,情况如下:
Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0. Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0. Table 'S_AUDIT_ITEM'. Scan count 1, logical reads 9770695, physical reads 0, read-ahead reads 1, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0. |
2.而右边使用fast forward only游标只有三次逻辑读,情况为:
Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0. Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0. Table 'S_AUDIT_ITEM'. Scan count 1, logical reads 3 , physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0. |
从这里输出的结果的区别,说明了在table S_AUDIT_ITEM上SQL Server使用了不同的访问方式
接下来我们分析两个脚本的执行计划:
1. dynamic游标对应的不理想的执行计划中,SQL Server选择了索引扫描(index scan)及索引S_AUDIT_ITEM_M4来查阅S_AUDIT_ITEM表。因此我们会在这里看到大量的IO。
这个索引扫描实际上访问了整张表的数据。
2.而fast forward only游标对应的理想的执行计划中,SQL Server选择的是索引查找(index seek)及索引S_AUDIT_ITEM_M3来查阅S_AUDIT_ITEM表。所以我们只看到3个逻辑读。索引S_AUDIT_ITEM_M3包含4个列,第一个列是RECORD_ID。另外,在语句中,有WHERE条件T1.RECORD_ID=@P2
四,尝试解决问题
首先我们尝试更新统计信息:UPDATE STATISTICS ON S_AUDIT_ITEM WITH FULLSCAN,但是这个操作在此问题案例中没有作用。
从以上的分析中,我们已经发现,如果使用index S_AUDIT_ITEM_M3访问S_AUDIT_ITEM表,得到的执行计划非常好,我们可以直接用index hint来解决这个问题:
declare @p1 int set @p1=NULL
declare @p2 int set @p2=0
declare @p5 int set @p5=4098
declare @p6 int set @p6=8193
declare @p7 int set @p7=0
exec sp_cursorprepexec @p1 output,@p2 output,N'@P1 varchar(30),@P2 varchar(15)',
N'
SELECT T1.CONFLICT_ID
FROM dbo.S_AUDIT_ITEM T1 with (INDEX=S_AUDIT_ITEM_M3) /* 解决方案2 */
LEFT OUTER JOIN dbo.S_USER T2
ON T1.USER_ID = T2.PAR_ROW_ID
WHERE ((T1.BC_BASE_TBL = @P1)
AND (T1.RECORD_ID = @P2))
ORDER BY T1.OPERATION_DT DESC
OPTION (FAST 40)
',
@p5 output,@p6 output,@p7 output,'1-10350J','S_PARTY'
print 'fetch'
exec sp_cursorfetch @p2,2,4,1
exec sp_cursorclose @p2
To be continued…