优化体系--oracle索引篇

概述

关于优化这个体系博大精深，例如内核优化、系统优化、中间件优化、oracle优化、sql优化、网络优化等等，网上很多思路都比较偏，比较杂，后面小编会花比较多时间去梳理下这方面内容，深入研究下这方面，试着去做个大致优化的体系和思路。

下面主要讲索引方面的内容，基本概念就不做介绍啦。

索引原理

1. 若没有索引，搜索某个记录时（例如查找name='wish'）需要搜索所有的记录，因为不能保证只有一个wish，必须全部搜索一遍

2. 若在name上建立索引，oracle会对全表进行一次搜索，将每条记录的name值哪找升序排列，然后构建索引条目（name和rowid），存储到索引段中，查询name为wish时即可直接查找对应地方

3.创建了索引并不一定就会使用，oracle自动统计表的信息后，决定是否使用索引，表中数据很少时使用全表扫描速度已经很快，没有必要使用索引

索引的类型与结构

1、索引类型

从总的概念上来说，索引分为B树索引（也叫平衡树索引，即就是什么都不写，最常用）和位图索引（多用于数据仓库）。这两种索引在逻辑结构（存储）上完全不同。

1.1、B树索引

其中B树索引又可以具体分为：

（1）唯一索引：

唯一索引确保在定义索引的列中没有重复值，Oracle 自动在表的主键列上创建唯一索引。

使用CREATE UNIQUE INDEX语句创建唯一索引

语法：create unique index index_name on table_name (column_name);

具体列值：索引相关列上的值必须唯一，但可以不限制NULL值。

（2）组合索引：

组合索引是在表的多个列上创建的索引，索引中列的顺序是任意的。

如果 SQL 语句的 WHERE 子句中引用了组合索引的所有列或大多数列，则可以提高检索速度

语法：create index index_name on table_name (column_name1，column_name2);

具体列值：该表中的元组由两列共同确定一行，例如班级号学号唯一确定一个学生。

（3）反向键索引：

反向键索引反转索引列键值的每个字节，为了实现索引的均匀分配，避免b树不平衡。

通常建立在值是连续增长的列上，使数据均匀地分布在整个索引上

创建索引时使用REVERSE关键字

语法：create index index_name on table_name (column_name) reverse;

具体列值：适用于某列值前面相同，后几位不同的情况，例如

sno： 1001 1002 1003 1004 1005 1006 1007

索引转化：1001 2001 3001 4001 5001 6001 7001

（4）位图索引：

位图索引适合创建在低基数列上

位图索引不直接存储ROWID，而是存储字节位到ROWID的映射

节省空间占用

如果索引列被经常更新的话，不适合建立位图索引

总体来说，位图索引适合于数据仓库中，不适合OLTP中

语法：create bitmap index index_name on table_name (column_name);

具体列值：不适用于经常更新的列，适用于条目多但取值类别少的列，例如性别列。

（5）基于函数的索引：

基于一个或多个列上的函数或表达式创建的索引，表达式中不能出现聚合函数

不能在LOB类型的列上创建

创建时必须具有 QUERY REWRITE 权限

语法：create index index_name on table_name (函数（column_name)）;

具体列值：不能在LOB类型的列上创建，用户在该列上对该函数有经常性的要求。

例如：用户不知道存储时候姓名是大写还是小写，使用

select * from student where upper(sname)=’TOM’；

2、索引结构

索引的结构是一个倒立的树状结构，其中每个节点的左子树比他的右子树小，索引最终指向表里面的数据与表里面的数据对应。

如上图，前三行是索引的内部构造，第三行与最后一行，这是索引指向表里数据的一个指向。索引是建立在列上的。最后一行是索引建立在表中某列上的值。

根节点块 ：如果索引列的值>0时，指向B1这个分支节点块，如果索引列的值>500时，指向B2这个分支节点块，如果索引列的值>1000时，指向B3这个分支节点块。

分支节点块：对于B1来说，再进行细分如果索引列的值>0且<200时，指向L1这个分支节点块，如果索引列的值>200且<400时，指向L2这个分支节点块，如果索引列的值>400且<500时，指向L3这个分支节点块。

叶子节点块：对于L1来说，如果数据行的值为0，那就放在R1这个数据行中，如果数据行的值为29，那就放在R2这个数据行中，如果数据行的值为190，那就放在R3这个数据行中，等。

SQL什么条件会使用索引？

当字段上建有索引时，通常以下情况会使用索引：

INDEX_COLUMN = ?

INDEX_COLUMN > ?

INDEX_COLUMN >= ?

INDEX_COLUMN < ?

INDEX_COLUMN <= ?

INDEX_COLUMN between ? and ?

INDEX_COLUMN in (?,?,...,?)

INDEX_COLUMN like ?||'%'（后导模糊查询）

T1. INDEX_COLUMN=T2. COLUMN1（两个表通过索引字段关联）

SQL什么条件不会使用索引？

一般在什么字段上建索引？

主键及外键通常都要有索引，其它需要建索引的字段应满足以下条件：

1、字段出现在查询条件中，并且查询条件可以使用索引；

2、语句执行频率高，一天会有几千次以上；

以下是一些字段是否需要建B-TREE索引的经验分类：

索引对DML(INSERT,UPDATE,DELETE)附加的开销有多少？

这里还没有去做实验认真测试过，主要与每个表记录的大小及索引字段大小密切相关，参考了其他人对一个普通表的测试数据：

索引对于Insert性能降低56%

索引对于Update性能降低47%

索引对于Delete性能降低29%

因此对于写IO压力比较大的系统，表的索引需要仔细评估必要性，另外索引也会占用一定的存储空间。如果不涉及增删改，可以考虑使用索引。

PS:顺便问一个问题：B+树跟B树索引有什么区别？

关于索引这块讲的还是比较浅显，后面再介绍相关的实验加深下对于索引这一块的印象，感兴趣的朋友可以关注下！

内容来源：今日头条

继续阅读（剩余50%