explain的使用

> sql优化是高级工程师必修课，对于百万级以上的数据，要避免全表扫描，可以借助一些分析工具查看sql执行过程，进而优化sql explain显示了MySQL如何使用索引来处理select语句以及连接表。可以通过模拟mysql的优化器帮助选择更好的索引和写出更优化的查询语句。首先，我们来明确下explain能干嘛 ? - 表的读取顺序 - 数据读取操作的操作类型 - 哪些索引可以使用 - 哪些索引被实际使用 - 表之间的引用 - 每张表有多少行被优化器查询 - 说了这么多使用explain的好处,那么实际上到底该怎么玩? 答案： **explain + 待执行的sql** ![](https://upload-images.jianshu.io/upload_images/20891914-af5544a9c4e206b3.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 从上表中我们看到,通过explain+sql执行后，显示了一张列表,那么接下来我们就详细说说这个个列表中表头各个字段的意思，只有先明确了各个字段的意思，才能知道sql 的优劣程度! --- # 1、id：决定表的读取顺序执行select 语句查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序它有三种情况: >- id相同，执行顺序由上至下； >- id不同，如果是子查询，id的序号会递增，id值越大优先级越高,越先被执行; >- id相同不同，同时存在，如果id相同，可以认为是一组，从上往下顺序执行,在所有组中，id值越大，优先级越高，越先执行； # 2. select_type:查询的类型 **也就是数据读取操作的操作类型，他一共有以下5种:** >**1. simple：** 简单的select查询,查询中不包含子查询或者union; > >**2. primary/union：** >- primary：查询中最外层的SELECT（如两表做UNION或者存在子查询的外层的表操作为PRIMARY，内层的操作为UNION） >- union：union操作中，查询中处于内层的select（内层的select语句与外层的select语句没有依赖关系） > >**3. dependent union / union result：** >- dependent union：union操作中，查询中处于内层的select（内层的select语句与外层的select语句有依赖关系） >- union result：union 操作的结果，id值通常为null > >**4. subquery / dependent subquery：** >- subquery：子查询中首个select（如果有多个子查询存在） >- dependent subquery：子查询中首个SELECT，但依赖于外层的表（如果有多个子查询存在） > >**5. derived/MATERIALIZED：** >- derived:在from列表中包含的子查询被标记为DERIVED(衍生表),mysql会递归执行这些子查询,把结果放临时表中; >- MATERIALIZED：被物化的子查询 > >**6. UNCACHEABLE SUBQUERY/UNCACHEABLE UNION：** >- UNCACHEABLE SUBQUERY：对于外层的主表，子查询不可被物化，每次都需要计算（耗时操作） >- UNCACHEABLE UNION：UNION操作中，内层的不可被物化的子查询（类似于UNCACHEABLE SUBQUERY） # 3. type:访问类型排列显示查询使用了何种类型,从最好到最差依次是:system > const > eq_ref > ref > range > index > all [explain 的type类型的理解](https://www.jianshu.com/p/ed9819f0fe61) >- system：表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,这个也可忽略不计; >- const：表示通过索引一次就找到了，const用于比较primary key或者unique索引。因为只匹配一行记录,所以很快. 如果将主键置于>- where列表中,mysql就能将该查询转换成一个常量; >- eq_ref：唯一性索引扫描,对于每一个索引键,表中只有一条记录与之匹配,常用于主键或唯一索引扫描; >- ref：非唯一性索引扫描,返回匹配某个单独值得所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体; >- range：只检索给定范围的行,使用一个索引来选择行,key列显示使用哪个索引,一般就是在你的where语句中出现了between,<,>,in等的查询；这种范围索引扫描比全表扫描要好,因为它只需要开始于索引的某一个点,结束于另一个点,不用扫描全部索引; >- index：index于all区别为index类型只遍历索引树,这通常比all快,因为索引文件通常比数据文件小;也就是说虽然all和index都是读写表,但index是从索引中读取的,而all是从硬盘中读的; >- all：也就是全表扫描; 备注:一般来说,得保证查询至少达到range级别,最好能达到ref. # 4. possible_keys：显示可能会被应用到这张表的索引,一个或者多个查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用到; # 5. key：实际使用到的索引如果为null,则没有使用索引;查询中若使用了覆盖索引,则该索引仅出现在key列表中; # 6. key_len：表示索引中使用的字节数可通过该列计算查询中使用的索引的长度,在不损失精确性的情况下,长度越短越好; key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的; # 7. ref：显示索引的哪一列被使用了如果可能的话,是一个常数,哪些列或常量别用于查找索引列上的值; --- # 8. rows：根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数; # 9. Extra：包含不适合在其它列中显示但十分重要的额外信息: >- **using filesort**(出现这个东西不好)：说明mysql中无法利用索引来完成排序，这时候使用文件排序。其效率很低 > >- **using temporary**(出现这个东西更不好,使用到了临时表)：使用了临时表保存中间结果,Mysql在对查询结果排序时使用临时表,常见于排序order by和分组查询group by. > >- **using index**：表示相应的select操作中使用了覆盖索引(Covering Index),避免了访问了表的数据行,效率不错！ > >如果同时出现using where ,表明索引被用来执行索引键值的查找; >如果没有同时出现using where,表明索引用来读取数据而非执行查找操作； >- **using where**：使用了where >- **using join buffer**：使用了连接缓存; >- **impossible where**：where 子句的值总是false,不能用来获取任何元素; >- **select tables optimized away**：在没有group by子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化count(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化; >- **distinct** ：去掉重复的数据转载：[https://www.jianshu.com/p/d4863178b4f8](https://www.jianshu.com/p/d4863178b4f8)