DB2终极SQL性能调节技术经典版

数据库
在这里我们主要向大家讲述的是DB2终极SQL性能调节技术,主要涉及到的有指针对于DB2数据库性能的影响,DB2性能调节技术等相关内容的介绍。

以下的文章主要向大家描述的是DB2终极SQL性能调节技术,其中包括指针对于DB2数据库性能的影响,DB2性能调节技术以及对更多未来的调节技术这些内容的详细描述,以下就是文章的主要内容讲述。

DB2,SQL,调优

使用针对工作负载的正确的性能调节技术,以避免硬件升级和优化DB2性能

性能通过响应时间,吞吐量,峰值响应时间,命中和每秒会话来衡量。SQL编码和调节技术直接影响性能。开发高性能的DB2应用需要对DB2技术的深入了解。

当然在小数据量时这些技术无足轻重。忽略的连接,子查询,表的表达式和CASE表达式的程序完全可以在轻量级负载下工作的很好。使用100%的SELECT INFO语句来进行数据获取的程序,在开始会非常的迅速。

但是一旦数据量和会话速度增加,性能将受到很大影响。DB2的可扩展性需要小的,优化的SQL加上方案设计,性能结构,缓冲池,和针对工作负载模式优化的存储。另外的方案就是升级硬件了。当然对于有着硬件升级的无尽预算的人来说,不用阅读本文了。对于其他人,我将讲解如何编码聪明的SQL以及调优的访问路径。

指针对于DB2性能的影响

曾经有段时间,在一个大的复杂的银行应用程序中存在着一个批处理程序。这个新的批处理程序和访问路径被通过代码走查的方式检查过了。因为项目截止日期的原因测试很少;在实际的首次运行中,程序在运行10个小时之后终止了。

一个很慢的代码走查之后,发现了7个指针,每个指针访问一个不同的表中的数据。每个指针在其他打开的指针的循环中被打开,在彼此间传递数据。也就是说,这个程序在DB2以外竟然结合了7个表。这不是聪明的SQL。这个信息需要进入到7个表;然而,每个指针只能进入一个。因此,7个指针被合并为一个聪明的指针: 

  1. SELECT COL1, COL2, rest of the columns  
  2. FROM ADDR A, NAME N, T3, T4, T5, T6, T7  
  3. WHERE A.COL1 = N.COL9  
  4. AND N.COL9 = T3.COL3  
  5. AND T3.COL3 = T4.COL4  
  6. AND T4.COL4 <> T5.COL5  
  7. AND T4.COLX <> T5.COLY  
  8. AND T5.COL6 = T6.COL6  
  9. AND T6.COL6 = T7.COL7  
  10. AND T6.CODE = :hv  

这个批处理在第二天用了四分钟就完成了。大多数人可能会结束这个成功的任务了,但是务实的人不会。一个缓慢的EXPLAIN信息走查发现了一个有趣的表连接序列问题。优化器选择了开始7个表的复杂的循环连接,还使用了一系列的大的数据表(ADDR和NAME),它们每个都包含5千万行数据。这不是DB2优化器的典型行为。然而,有一些使用<>比较小表之间列的连接情况。

这些比较对于优化器来说很难估计,因为DB2 catalog包含了相等列而非不等列。这里就需要访问路径优化了。DB2优化者脑中肯定有多种推荐的解决方案,一些可以在包或语句层次上,另外的一些工作在谓词层次。当然还有其他一些传统方式不奏效情况下的DB2终极技术。

一个要求就是如下的性能调节技术提供给你的catalog以足够的统计,使用统计向导来保证优化器有关于你的数据的精确全景。

DB2性能调节技术

包级别的SQL调优——需要REOPT(ONCE/ALWAYS/AUTO) BIND选项。这个语句通告优化器来在运行时重新优化包中的每个语句,至少ONCE,或者ALWAYS(每次执行),在DB2 9中可以AUTO(需要时)。这项技术的开销由选择的选项和SQL语句的数量及复杂性决定。这些开销在批处理程序中可以忽略不计,但是在短期运行的交易中会有很大影响。在我们的例子中,批处理程序指针只有一个谓词和一个基数为1的主机变量。REOPT是一个调节选项,用来优化非统一列值分布和主机变量内容高可变的情况,是COLCARDF=1的反面。包级别的调节并不合适。

语句级别的调节技术——包括OPTIMIZE FOR n ROWS和FETCH FIRST n ROWS ONLY。这些语句,放在SELECT语句末尾,是在不需要结果集的情况下进行优化的。优化器假设除了这些语句的所有的SELECT语句需要整个结果,这些结果偏向于诸如数序和表预取的访问路径。因为我们的批处理指针一定需要整个结果,因此语句级别的调节也不是合适的技术。

谓词界别的调节技术——包括增加一个假的过滤器(TX.CX=TX.CX)或增加一个空操作到谓词上(+0,-0,/1,*1, CONCAT ‘’)。一个假的过滤器能够通过减少总过滤器因素(表中满足资格的行的比例)改变优化器。这个方法能够改变表连接的顺序,索引选择和连接方法。多个假过滤器是允许的,但是必须在没有引用过的一列上。

空操作(no op)能够通过降级一个过滤器从符合到不符合来改变优化器的工作方式,但是只在z/OS上有用,LUW优化器却不受其影响。这个改变也会影响一个表连接序列,索引选择和连接方法。谓词级别的技术可以被一起使用来获取想要的结果。我们例子中的指针对多个谓词级别调节的结合不起反应,因此是采用重武器的时候了。

一些终极调节技术包括使用DISTINCE的表的表达式和其他DB2终极跨查询的块优化方法。这些技术要求手动查询重写。它们强制使得优化器以一个指定顺序的方式执行查询块。使用这些技术视需要终极提醒的,因为他们能把表连接序列,索引选择和连接方法从好改到坏。DISTINCE表表达式强制优化器优先于其他查询块执行圆括号中的查询。

如果SELECT DISTINCE中指定的列引用了不同的表,表表达式可以被实例化为唯一的以供排序。我们的批处理指针有一个非优化的连接序列,使用该技术得到如下查询:

  1. SELECT All columns needed FROM ADDR, NAME, (SELECT DISTINCT columns from tables 3 through 7  
  2. FROM T3, T4, T5, T6, T7  
  3. WHERE join conditions T3 through T7  
  4. AND T6.CODE =:hv) AS TEMP  
  5. WHERE join conditions for ADDR, NAME and TEMP  

这样的查询重写迫使优化器通过T7连接表T3来连接ADDR和NAME。如果关键字DISTINCT在上例中省略了,DB2优化器合并表表达式查询和输出查询,这样就和原来的语句和连接序列一样了。

SELECT DISTINCT是一个关键的组件。然而,因为列列表跨越了多个表,临时的5个表连接结果实例为一个唯一的工作文件以供排序。排序的开销平均在每次执行几千行,这是可以忽略的负载。批处理程序现在可以在两分钟之内完成任务了。

更多未来的调节技术

其他的一些查询重写技术从全异的查询块中获取信息,以重写查询。IBM曾经将此技术成为跨查询块优化;DB2 9中被成为全局优化。一个好消息就是这项技术开始在DB2优化器的自我查询重写(QWR)阶段中出现了。所有DB2查询都能使用它也是指日可待了。同时,我们也需要将一些DB2终极方法掌握在自己的手里。

【编辑推荐】

  1. DB2数据库备份,恢复命令的操作经验总结
  2. DB2恢复删除表的实际操作技巧演示
  3. DB2 Online备份的操作方案“盛宴”
  4. DB2重定向恢复失败“水到渠成”
  5. 使DB2数据库备份和恢复的效率大大增加的秘诀

 

 

 

责任编辑:佚名 来源: 51CTO.com
相关推荐

2010-08-20 12:49:49

DB2 pureXML

2010-07-30 14:14:11

DB2快照函数

2010-08-19 11:33:43

DB2常用函数

2010-09-06 16:36:20

DB2快照函数

2010-08-12 09:33:30

DB2数据库备份

2010-08-05 10:10:51

DB2 SQL存储过程

2010-08-03 13:23:47

DB2自动增长主键

2011-03-21 09:51:04

DB2性能优化

2010-08-02 10:52:31

DB2取得当前时间

2010-08-13 10:43:49

IBM DB2数据库

2010-08-16 14:39:09

DB2数据库解死锁

2010-09-06 15:00:40

DB2 9 XML

2010-09-06 15:13:05

DB2

2010-11-04 15:39:40

DB2 SQL语句

2010-08-10 17:33:42

DB2 优化器

2010-08-17 17:29:06

DB2性能优化

2010-09-30 16:00:40

DB2动态SQL

2010-09-06 12:44:24

DB2数据库

2010-08-09 16:51:24

DB2数据库

2010-08-04 15:59:29

点赞
收藏

51CTO技术栈公众号