一、查询优化
1,mysql的调优大纲
- 慢查询的开启并捕获
- explai
本文来源gaodai.ma#com搞##代!^码@网3
n+慢SQL分析
- show profile查询SQL在Mysql服务器里面的执行细节和生命周期情况
- SQL数据库服务器的参数调优
2,小表驱动大表
mysql的join实现原理是,以驱动表的数据为基础,“嵌套循环”去被驱动表匹配记录。驱动表的索引会失效,而被驱动表的索引有效。
#假设 a表10000数据,b表20数据 select * from a join b on a.bid =b.id
a表驱动b表为: for 20条数据 匹配10000数据(根据on a.bid=b.id的连接条件,进行B+树查找) 查找次数为:20+ log10000 b表驱动a表为 for 10000条数据 匹配20条数据(根据on a.bid=b.id的连接条件,进行B+树查找)查找次数为:10000+ log20
3,in和exists
exists的使用
- EXISTS 语法:EXISTS(subquery) 只返回TRUE或FALSE,因此子查询中的SELECT *也可以是SELECT 1或其他,官方说法是实际执行时会忽略SELECT清单,因此没有区别
- SELECT … FROM table WHERE EXISTS(subquery)
- 该语法可以理解为:将查询的数据,放到子查询中做条件验证,根据验证结果(TRUE或FALSE)来决定主查询的数据结果是否得以保留。
- EXISTS子查询的实际执行过程可能经过了优化而不是我们理解上的逐条对比,如果担忧效率问题,可进行实际检验以确定是否有效率问题。
- EXISTS子查询往往也可以用条件表达式、其他子查询或者JOIN来替代,何种最优需要具体问题具体分析
#采用in则是,内表B驱动外表A select * from A where id in (select id from B) #采用exists则是,外表A驱动内表B select * from A where exists(select 1 from B where B.id = A.id)
结论:
永远记住小表驱动大表 当 B 表数据集小于 A 表数据集时,使用 in 当 A 表数据集小于 B 表数据集时,使用 exist
4,orderby创建表
create table tblA( #id int primary key not null auto_increment, age int, birth timestamp not null ); insert into tblA(age, birth) values(22, now()); insert into tblA(age, birth) values(23, now()); insert into tblA(age, birth) values(24, now()); #创建复合索引 create index idx_A_ageBirth on tblA(age, birth);
orderby命中索引的情况
orderby未命中索引的情况
- MySQL支持两种排序方式:Using index和Using filesort。filesort效率较低,而要使用index方式排序需满足两种使用条件尽可能在索引列上完成排序操作,遵照索引的最佳左前缀
- order by语句自身使用索引的最左前列
- 使用where子句与order by子句条件列组合满足最左前列
- 如果order by不在索引列上,会使用filesort算法:双路排序和单路排序
- MySQL4.1之前是使用双路排序,字面意思是两次扫描磁盘,最终得到数据。读取行指针和order by列,对他们进行排序,然后扫描已经排序好的列表,按照列表中的值重新从列表中读取对应的数据传输
- 从磁盘读取查询需要的所有列,按照order by列在buffer对它们进行排序,然后扫描排序后的列表进行输出,它的效率更快一些,避免了第二次读取数据,并且把随机IO变成顺序IO,但是它会使用更多的空间,因为它把每一行都保存在内存中了。
select * from user where name = "zs" order by age #双路排序 1)从 name 找到第一个满足 name = 'zs' 的主键id 2)根据主键 id 取出整行,把排序字段 age 和主键 id 这两个字段放到 sort buffer(排序缓存) 中 3)从name 取下一个满足 name = 'zs' 记录的主键 id 4)重复 2、3 直到不满足 name = 'zs' 5)对 sort_buffer 中的字段 age 和主键 id 按照字段 age进行排序 6)遍历排序好的 id 和字段 age ,按照 id 的值回到原表中取出 所有字段的值返回给客户端 #单路排序 1)从name找到第一个满足 name ='zs' 条件的主键 id 2)根据主键 id 取出整行,取出所有字段的值,存入 sort_buffer(排序缓存)中 3)从索引name找到下一个满足 name = 'zs' 条件的主键 id 4)重复步骤 2、3 直到不满足 name = 'zs' 5)对 sort_buffer 中的数据按照字段 age 进行排序,返回结果给客户端