46. 连接多个扫描
如果你对一个列和一组有限的值进行比较, 优化器可能执行多次扫描并对结果进行合并连接.
举例:
select *
from lodging
where manager in (‘bill gates’,’ken muller’);
优化器可能将它转换成以下形式
select *
from lodging
where manager = ‘bill gates’
or manager = ’ken muller’;
当选择执行路径时, 优化器可能对每个条件采用lodging$manager上的索引范围扫描. 返回的rowid用来访问lodging表的记录 (通过table access by rowid 的方式). 最后两组记录以连接(concatenation)的形式被组合成一个单一的集合.
explain plan :
select statement optimizer=choose
concatenation
table access (by index rowid) of lodging
index (range scan ) of lodging$manager (non-unique)
table access (by index rowid) of lodging
index (range scan ) of lodging$manager (non-unique)
译者按:
本节和第37节似乎有矛盾之处.
47. cbo下使用更具选择性的索引
基于成本的优化器(cbo, cost-based optimizer)对索引的选择性进行判断来决定索引的使用是否能提高效率.
如果索引有很高的选择性, 那就是说对于每个不重复的索引键值,只对应数量很少的记录.
比如, 表中共有100条记录而其中有80个不重复的索引键值. 这个索引的选择性就是80/100 = 0.8 . 选择性越高, 通过索引键值检索出的记录就越少.
如果索引的选择性很低, 检索数据就需要大量的索引范围查询操作和rowid 访问表的
操作. 也许会比全表扫描的效率更低.
译者按:
下列经验请参阅:
a. 如果检索数据量超过30%的表中记录数.使用索引将没有显著的效率提高.
b. 在特定情况下, 使用索引也许会比全表扫描慢, 但这是同一个数量级上的
区别. 而通常情况下,使用索引比全表扫描要块几倍乃至几千倍!
48. 避免使用耗费资源的操作
带有distinct,union,minus,intersect,order by的sql语句会启动sql引擎
执行耗费资源的排序(sort)功能. distinct需要一次排序操作, 而其他的至少需要执行两次排序.
例如,一个union查询,其中每个查询都带有group by子句, group by会触发嵌入排序(nested sort) ; 这样, 每个查询需要执行一次排序, 然后在执行union时, 又一个唯一排序(sort unique)操作被执行而且它只能在前面的嵌入排序结束后才能开始执行. 嵌入的排序的深度会大大影响查询的效率.
通常, 带有union, minus , intersect的sql语句都可以用其他方式重写.
译者按:
如果你的数据库的sort_area_size调配得好, 使用union , minus, intersect也是可以考虑的, 毕竟它们的可读性很强
49. 优化group by
提高group by 语句的效率, 可以通过将不需要的记录在group by 之前过滤掉.下面两个查询返回相同结果但第二个明显就快了许多.
低效:
select job , avg(sal)
from emp
group job
having job = ‘president’
or job = ‘manager’
高效:
select job , avg(sal)
from emp
where job = ‘president’
or job = ‘manager’
group job
译者按:
本节和14节相同. 可略过.
50. 使用日期
当使用日期是,需要注意如果有超过5位小数加到日期上, 这个日期会进到下一天!
例如:
1.
select to_date(‘01-jan-93’+.99999)
from dual;
returns:
’01-jan-93 23:59:59’
2.
select to_date(‘01-jan-93’+.999999)
from dual;
returns:
’02-jan-93 00:00:00’
译者按:
虽然本节和sql性能优化没有关系, 但是作者的功力可见一斑
51. 使用显式的游标(cursors)
使用隐式的游标,将会执行两次操作. 第一次检索记录, 第二次检查too many rows 这个exception . 而显式游标不执行第二次操作.
52. 优化export和import
使用较大的buffer(比如10mb , 10,240,000)可以提高export和import的速度.
oracle将尽可能地获取你所指定的内存大小,即使在内存不满足,也不会报错.这个值至少要和表中最大的列相当,否则列值会被截断.
译者按:
可以肯定的是, 增加buffer会大大提高export , import的效率. (曾经碰到过一个case, 增加buffer后,import/export快了10倍!)
作者可能犯了一个错误: “这个值至少要和表中最大的列相当,否则列值会被截断. “
其中最大的列也许是指最大的记录大小.
关于export/import的优化,csdn论坛中有一些总结性的贴子,比如关于buffer参数, commit参数等等, 详情请查.
53. 分离表和索引
总是将你的表和索引建立在不同的表空间内(tablespaces). 决不要将不属于oracle内部系统的对象存放到system表空间里. 同时,确保数据表空间和索引表空间置于不同的硬盘上.
译者按:
“同时,确保数据表空间和索引表空间置与不同的硬盘上.”可能改为如下更为准确 “同时,确保数据表空间和索引表空间置与不同的硬盘控制卡控制的硬盘上.”
(全文完)
black_snail
[email protected]
4/sep/2003