作者 | 京东云开发者-刘邓忠
mysql 是大家最常用的数据库,下面为大家带来 mysql 索引下推知识点的分享,以便巩固 mysql 基础知识,如有错误,还请各位大佬们指正。
1 什么是索引下推
索引下推 (index condition pushdown,索引条件下推,简称 icp),是 mysql5.6 版本的新特性,它可以在对联合索引遍历过程中,对索引中包含的所有字段先做判断,过滤掉不符合条件的记录之后再回表,能有效的减少回表次数(目前我们使用的 mysql 版本较高,一般大家可能感觉这是正常的,但是 mysql5.6 之前都不是这样实现的,下面会细细道来)。
1.1 适用条件
我们先来了解一下索引下推的使用条件及限制:
只支持 select。
当需要访问全表时,icp 用于 range,ref,eq_ref 和 ref_or_null 访问类型。
icp 可用于 innodb 和 myisam 表,包括分区的 innodb 和 myisam 表。(5.6 版本不适用分区表查询,5.7 版本后可以用于分区表查询)。
对于 inndb 引擎只适用于二级索引(也叫辅助索引),因为 inndb 的聚簇索引会将整行数据读到 inndb 的缓冲区,这样一来索引条件下推的主要目的减少 io 次数就失去了意义。因为数据已经在内存中了,不再需要去读取了。
在虚拟生成列上创建的辅助索引不支持 icp(注:innodb 支持虚拟生成列的辅助索引)。
使用了子查询的条件无法下推。
使用存储过程或函数的条件无法下推(因为因为存储引擎没有调用存储过程或函数的能力)。
触发条件无法下推。(有关触发条件的信息,请参阅官方资料:section 8.2.2.3, “optimizing subqueries with the exists strategy”.。)
1.2 原理介绍
首先,我们大致回顾下 mysql 的基本架构:
mysql 基本的架构示例图 mysql 服务层主要负责 sql 语法解析、生成执行计划等,并调用存储引擎层去执行数据的存储和查询。
索引下推的下推其含义就是指将部分上层(服务层)负责的事情,交给了下层(引擎层)去处理。
在 mysql 5.6 版本之前没有索引下推这个功能,从 5.6 版本后才加上了这个优化项。我们先简单对比一下使用和未使用 icp 两种情况下,mysql 的查询过程吧。
1) 未使用 icp 的情况下:
- 存储引擎读取索引记录;
- 根据索引中的主键值,定位并读取完整的行记录;
- 存储引擎把记录交给 server 层去检测该记录是否满足 where 条件。
2) 使用 icp 的情况下:
- 存储引擎读取索引记录(不是完整的行记录);
- 判断 where 条件部分能否用索引中的列来做检查,条件不满足,则处理下一行索引记录;
- 条件满足,使用索引中的主键去定位并读取完整的行记录(就是所谓的回表);
- 存储引擎把记录交给 server 层,server 层检测该记录是否满足 where 条件的其余部分。
2 具体示例
上面介绍了基本原理,下面使用示例,带大家更直观的进行理解(注:以下示例基于 innodb 存储引擎。)
首先,我们新建一张用户表(jxc_user),设置 id 为主键索引,并创建联合索引(name, age)。
我们先看一下该表主键索引的大致结构示例:
主键索引结构示例图 然后我们再看一下该表联合索引的大致结构示例:
联合索引结构示例图 如果现在有一个需求,要求检索出表中名字第一个字是张,而且年龄等于 10 岁的所有用户。示例 sql 语句如下:
select id,name,age,tel,addr from jxc_user where name like '张%' and age=10;
根据索引最左匹配原则,上面这个 sql 语句在查索引树的时候,只能用 “张”,查到第一个满足条件的记录:id 为 1。
那接下来我们具体看一下 使用与未使用 icp 的情况。
2.1 未使用 icp 的情况
在 mysql 5.6 之前,存储引擎根据联合索引先找到 name like ‘张 %’ 的主键 id(1、4),再逐一进行回表扫描,去聚簇索引找到完整的行记录,返回 server 层,server 层拿到数据后,再根据条件 age=10 对拿到的数据进行筛选。大致的示意图如下:
从上图,可以看到需要回表两次,存储引擎并不会去按照 age=10 进行过滤,相当于联合索引的另一个字段 age 在存储引擎层没有发挥作用,比较浪费。
2.2 使用 icp 的情况
而 mysql 5.6 以后, 存储引擎会根据(name,age)联合索引,找到 name like ‘张 %’,由于联合索引中包含 age 列,所以存储引擎直接再联合索引里按照条件 age=10 进行过滤,然后根据过滤后的数据再依次进行回表扫描。大致的示意图如下:
从上图,可以看到只是 id=1 的数据,回表了一次。 除此之外我们还可以看一下执行计划,看到 extra 一列里 using index condition,就是用到了索引下推。
3 控制参数
mysql 索引下推功能默认是开启的,可以用系统参数 optimizer_switch 来控制是否开启。
查看状态命令:
select @@optimizer_switch;
关闭命令:set optimizer_switch=”index_condition_pushdown=off”;
开启命令:set optimizer_switch=”index_condition_pushdown=on”;
4 总结
回表操作:当所要查找的字段不在非主键索引树上时,需要通过叶子节点的主键值去主键索引上获取对应的行数据,这个过程称为回表操作。
索引下推:索引下推主要是减少了不必要的回表操作。对于查找出来的数据,先过滤掉不符合条件的,其余的再去主键索引树上查找。
介绍西门子S7-1200PLC和V20变频器的Modbus通讯详细步
信产部泰尔实验室欲拆除生产商之间壁垒
有方扬尘监测系统助力提升环境治理能力
九轴姿态传感器的介绍和应用
PLC应用系统的设计原则
MySQL索引下推知识分享
Microchip推出全球第一款可编程USB2控制器集线器
电子芯闻早报:暴风魔镜发布新款VR 支持手势识别
什么是3C认证?
二极管用作平衡型AFC
如何格式化c盘
有意识的人工智能才是真正的人工智能
MacBook的Type-C接口有什么与众不同之处
RTC电池要不要串电阻?电阻阻值多少合适?
智能电网向泛在电力物联网过渡的两大本质介绍
乐声TC-29V2H彩电行幅增大并出现枕形失真
多网段水厂如何跨网段访问和IP隔离问题
PLC控制器和变频器技术在门机上的应用
医药冷链物流三要点:冷藏车、保温箱、温湿度记录仪
基于全聚合物电化学晶体管的触觉/味觉离电感受器