为何在查询中索引未被使用

数据库 Oracle
“为什么索引没有被使用”是一个涉及面较广的问题。有很多种原因会导致索引没有被使用。下面是一些非常有用的检查列表。请点击下面链接来查看文章的具体内容。

“为什么索引没有被使用”是一个涉及面较广的问题。有很多种原因会导致索引没有被使用。下面是一些非常有用的检查列表。请点击下面链接来查看文章的具体内容:

快速检查

表上是否存在索引?

检查您认为应该通过索引访问的表上是否真的有定义索引。那些索引可能已经被删掉或者在创建的时候就失败了 – 比如一种可能的场景是,在对表做导入或 load 操作后,由于软件或人为错误造成索引没有被创建。下面的语句可以用来检查索引是否存在。

  1. SELECT index_name FROM user_indexes WHERE table_name = &Table_Name; 

索引是否应该被使用?

Oracle 不会仅仅因为有索引存在就一定要使用索引。如果一个查询需要检索出这个表里所有的记录(比如说表之间做连接操作),那为什么还要既访问索引的所有数据又访问表的所有数据呢?在这种情况下只访问表的数据会更快。对所有的查询 Oracle Optimizer 会基于统计信息来计算各种访问路径,包括索引,从而选出***的一个。

索引本身的问题

索引列或者索引的前置列是否在单表(non-join)查询的 Where 条件中(predicate list)?

如果不是,至少需要索引前置列在查询谓词列表中,查询才能使用索引。(例外:请见下面的 Skip Scan)。

示例:

在列 EMP.EMPNO 上定义了单列索引 EMPNO_I1,同时在列 EMP.EMPNO 和 EMP.DEPT 上定义了联合索引 EMPNO_DEPT_I2(EMP.EMPNO为索引前置列)。那么必须在查询谓词列表中(where从句)使用列 EMP.EMPNO,优化器才能使用这两个索引中的某一个。

  1. SELECT ename, sal, deptno FROM emp WHERE empno<100; 

例外:

  • 只要索引中包含查询所需的所有列, 而且至少有一个索引列中含有非空约束,CBO 就能够使用索引快速全扫描(INDEX_FFS)。执行 INDEX_FFS 不需要索引前置列。需要注意的是 INDEX_FFS 不能保证返回的行是排序的。结果的顺序是与读取索引块的顺序一致的,只有当使用了 'order by' 子句时才能保证结果是排序的。
  • CBO 能使用 Index Skip Scan (INDEX_SS). 执行 INDEX_SS 不需要索引前置列。
  • CBO 能够选用一个索引来避免排序,但是索引列必须存于在 order by 子句中才可以。

索引列是否用在连接谓词中(join predicates)?

例如,下面这个连接谓词定义了如何在表 emp 和 dept 的 deptno 列上做连接:

  1. emp.deptno = dept.deptno 

如果索引列是连接谓词的一部分,那么查询在执行时使用了哪种类型的连接?

  • 哈希/排序合并连接(Hash / Sort Merge Join): 对于哈希连接和排序合并,在连接执行的时候,外部表的信息还没有获得,因此无法进行对内部表的行检索。它的处理方式是将外部表和内部表分别查询后将结果合并。哈希连接和排序合并的内部表不能通过连接的索引列单独被访问。这是连接类型的执行机制的限制。嵌套循环连接有所不同,它们允许通过索引查询内部表的连接列。
  • 嵌套循环连接(Nested Loops Join):嵌套循环连接读取外部表,然后利用所收集的信息访问内部表。该算法允许对内部表基于索引进行查询。

只有嵌套循环连接(Nested loops join)允许索引在内部表中仅基于连接列进行查找。

另外,连接的顺序(join order)是否允许使用索引?

一个嵌套循环连接的外部表必须已经访问过,才可以在内部表中使用索引。查看 explain plan,以确定哪些访问路径已经使用。由于这个限制,表的连接顺序是很重要的。

例如:

如果我们通过"emp.deptno = dept.deptno"来对 EMP 和 DEPT 做连接,并且在 EMP.DEPTNO 有一个索引,并假设查询中没有与 EMP.DEPTNO 相关的其他谓词,EMP 是在 DEPT 前被访问,然后没有值可用于在 EMP.DEPTNO 索引中查询。在这种连接顺序下,要想使用这个索引我们只能使用全索引扫描或索引快速全扫描。在这种情况下,全表扫描(FTS)的成本可能更小。

索引列在 IN 或者多个 OR 语句中?

比如:

  1. emp.deptno IN (10,23,34,....) 

  1. emp.deptno = 10 
  2.  
  3. OR emp.deptno = 23 
  4.  
  5. OR emp.deptno = 34 
  6.  
  7. ....  

这种情况下查询可能已经被转化为不能使用索引的语句。

索引列是否被函数修改?

索引不能用于被函数修改的列。函数索引(function based indexes)可以用来解决这个问题。

隐式类型转换(implicit type conversion)是什么?

如果进行比较的两个值的数据类型不同,则 Oracle 必须将其中一个值进行类型转换使其能够比较。这就是所谓的隐式类型转换。通常当开发人员将数字存储在字符列时会导致这种问题的产生。Oracle 在运行时会强制转化其中一个值,(由于固定的规则)在索引字符列使用 to_number。由于添加函数到索引列所以导致索引不被使用。实际上,Oracle 也只能这么做,类型转换是一个应用程序设计因素。由于转换是在每行都进行的,这会导致性能问题。

是否在语义(semantically)上无法使用索引?

出于对查询整体成本的考虑,一个成本较低的执行计划中可能是无法使用索引的。某索引可能已经被考虑在某种连接排序及方法中,但是成本***的那个执行计划中却无法从“语义”角度使用该索引。

错误类型的索引扫描?

例如:快速全索引扫描而不是索引范围扫描

这可能是优化器选择了所需的索引,但却使用了客户不希望的扫描方法。在这种情况下,利用 INDEX_FFS,INDEX_ASC 和 INDEX_DESC 提示来强制使用需要的扫描类型

我们还可以定义索引的排序顺序为递增或递减。Oracle 对待降序索引就好像它是基于函数的索引,因此与缺省使用的升序的执行计划不同。通过查看执行计划,您看不到使用升序或降序,需要额外检查视图 DBA_IND_COLUMNS 的'DESCEND'列。

是否索引列为可空?

索引不存储 NULL 值,除非该索引为联合索引(即多列索引),或者它是一个位图索引。

只有至少有一个索引列有值,联合索引才存储空值。联合索引中尾部的空值也会被存放在索引中。如果所有列的值都为空,这行将不会存储在索引中。由于索引中缺乏 NULL 值,那么一些结果中可能会返回 NULL 值(如count)的操作可能会被禁用索引。这是因为优化器不能保证在单独使用索引时可以获得准确的信息。关于使用 NOT IN 和 NULL 的其他一些考虑。

位图索引允许存储空值。因此优化器会使用这些索引,无论它们的结果可信与否。索引上的空值有时很有用,特别对于某些类型的 SQL 语句,如与聚合函数 COUNT 查询。示例:

  1. SELECT count(*) FROM emp; 

NLS_SORT是否设置为二进制(BINARY)?

如果 NLS_SORT 未设置为二进制,索引将不会被使用。这是因为索引是基于 Key 值的二进制顺序来建立的(pre-sorted使用二进制值)。无论优化器设置为何种方法,NLS_SORT 不是二进制时,将使用全表扫描,。更多关于NLS_SORT和索引的使用

是否使用的是不可见索引(invisible indexes)?

从 Oracle Database 11g Release 1开始,您可以创建不可见索引或将一个已经存在的索引标记为不可见。Optimizer 不会考虑不可见索引,除非在 session 或 system 级将参数 OPTIMIZER_USE_INVISIBLE_INDEXES 设置为 TRUE。DML 操作还是会维护这些不可见索引的。

优化器和成本计算相关问题

是否存在准确且合适的统计信息(Statistics)?

CBO 依赖于准确的、***的和完整的统计信息来确定一个特定查询的***执行计划。如果使用 CBO,请确保统计信息已经收集。如果没有统计信息, CBO 将使用预定义的统计信息,这样是很可能不会产生良好的计划或让应用程序使用索引。

请注意,CBO 会根据开销(COST)来决定使用不同的索引。除了基本的表和索引的信息之外,如果说在某些列上数据分布是不均匀的,那么还需要收集这些列的数据的分布。

在一般情况下,对象的数据或结构的改变会使以前的统计信息不准确,因此应该重新收集新的统计信息。例如,对表装载了大量的数据后,需要收集新的统计信息。安装新补丁集(Patchset)后,也建议重新收集统计信息。表访问***效果是统计信息是在相同版本的数据库中生成的。

一个索引是否与其它的索引有相同的等级或者成本(cost)?

对于相同开销(COST)的索引,CBO 会使用多种办法将不同的索引区分开,如将索引名称按字母顺序排序,完全匹配的索引扫描会选择更大的NDK(不同键值的个数)的索引(不适用于快速全扫描)或选择叶块数量较少的索引。请注意一般很少发生这种情况。

索引的选择度不高?

索引的选择度不高

使用它可能不是一个好的选择...

列数据不是平均分布的。

  • CBO 假定列数据不会倾斜,并均匀分布。如果不是这样,那么统计信息可能没有反映真实情况,那么即使某些值的选择度高,索引也会因为整个列的选择度不高而不适用索引。 如果是这种情况,那么应考虑采用直方图记录更准确的列的数据分布或者采用提示(hint)。
  • 统计信息不准确导致索引看起来选择性不高而不被选择。可能的规避方法:
  • 收集更精确的统计值。
  • 对于数据分布不均匀的列考虑收集列的统计信息

在总体成本中,表扫描的成本占大部分

通常来说,当使用索引的时候,我们需要再次检索表本身来找到索引中不存在的字段的值,这个操作比检索索引本身的开销要大很多。由于 optimizer 是基于总体的成本来计算执行计划,如果通过索引检索表的成本很大,并且超过了某个阀值,optimizer 就会考虑其他的访问路径。

比如:

  1. SELECT empno FROM emp WHERE empno=5 

这条语句可能会使用基于列 empno的索引,因为所有需要的数据都存放在索引中所以不需要再对表做而外的访问。反之:

  1. SELECT ename FROM emp WHERE empno=5 

这条语句会需要对表做而外的访问,因为 ename 字段没有存放在索引中。检索 ename 的开销会随着查询返回记录条数的增加而变得昂贵。

Optimizer 使用"Clustering Factor"来判断如果使用 index 的话需要而外对表做多少次访问

访问空索引并不意味着比访问有值的索引高效。

Reorganization, Truncation 或删除操作不一定会影响 SQL 语句执行的成本。需要注意的是删除操作并不会从对象中真正释放空间。也就是说,删除操作不会重置对象的高水位线。Truncate 操作会重置高水位线。空块的存在会使索引/表扫描的成本比实际应该的成本高。删掉并重建会重组对象的结构从而有可能会有帮助(也有可能变坏)。这类问题通常在比较两个有相同数据的不同系统查询性能时更容易看到。

参数设置

某些参数的设置可能会影响索引的使用。比如在大多数情况下都建议使用 DB_FILE_MULTIBLOCK_READ_COUNT 和 OPTIMIZER_INDEX_COST_ADJ 的默认值。除非某些特定的操作有特定的建议,使用其它值会使索引的成本不现实的减少或变大从而极大的降低查询的性能。

其它问题:

是否使用了视图/子查询?

查询涉及到视图或者子查询时可能会被改写,导致不使用索引(尽管该改写的目标之一是扩展更多的访问路径)。这些改写(rewrite)一般来说都是合并(merging)操作。

是否存在远程表(remote table)?

通常远程表不会使用索引。索引在分布式查询中的使用依赖于被发送到远程的查询。CBO 将评估远程访问的成本,并评估比较发送或者不发送索引的谓词到远程站点的成本。因此,CBO 可以做出有关远程表上使用索引的更加明智的决定。一个非常有效的方法就是,在远程建立包含相关谓词的视图并强制使用索引,之后在本地查询中使用这个视图。

是否使用并行执行(PX)?

在并行执行时索引的采用比在串行执行((serial execution))时更加严格。一个快速检测的方法就是禁用并行,然后查看该索引是否被使用。

是否是包含了子查询的Update语句?

在一些情况下,基于成本的考虑,索引没有被选使用是因为它依赖于一个子查询返回的值。这种情况下,可以使用提示(hint)来强制使用索引。

查询是否使用了绑定变量?

CBO 对 like 或范围谓词的绑定变量不能产生准确的成本(cost)。这可能会导致索引不被选择。

查询是否引用了带有延迟约束的列?

如果一个表中的某一列上含有延迟约束(比如 NOT NULL)并且这一列上有索引,那么不管这个约束当前是延迟状态或是被显式地设置为立即使用,我们都不会考虑使用这一列上的索引。例如:

 

这个现象在以下 bug 中记录,关闭为"not a bug":

索引提示(hint)不工作

请使用表的别名

有用的 hints: 

责任编辑:庞桂玉 来源: Oracle疑点通
相关推荐

2015-04-01 11:36:25

SQL Server索SQL Server调数据库索引

2016-07-05 09:38:16

2024-02-19 16:37:01

云计算云迁移

2010-10-25 10:55:11

Oracle函数索引

2013-11-25 15:12:26

iOS开发

2020-06-04 12:02:47

物联网业务数字孪生IOT

2010-08-04 13:58:13

数据中心电力资源

2023-03-05 19:28:11

JavaScripCSS

2023-05-22 14:19:48

索引Iceberg

2010-03-03 10:03:09

DB2DBA

2011-10-31 09:38:06

Windows serGUI

2020-08-10 11:20:59

索引MySQL数据库

2021-04-12 16:21:32

编程程序员技术

2011-10-31 09:36:38

微软windows serGUI

2018-12-25 16:30:15

SQL Server高效分页数据库

2016-08-15 12:57:01

数据仓库索引架构维度索引

2018-10-11 09:40:53

前端JavaScript编程语言

2022-12-08 08:00:00

.NET 7BitArray数据执行

2021-01-15 11:22:29

iOS加密措施数据

2022-04-06 15:59:11

大数据HDFS存储系统
点赞
收藏

51CTO技术栈公众号