本篇文章小编给大家分享一下mysql高效查询left join和group by代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看。
mysql高效查询
mysql牺牲了group by来增加left join的速度(前提是加了索引)。
user表:10万数据
实例1: 200秒左右
SELECT U.id, A.favorite_count FROM (SELECT id from user) U LEFT JOIN ( -- 点赞数 SELECT favorite_by AS user_id, SUM(favorite_count) AS favorite_count FROM favorite GROUP BY favorite_by ) A ON U.id=A.user_id LEFT JOIN ( -- 评论数量 SELECT user_id, COUNT(*) AS comment_count FROM photo_comment GROUP BY user_id ) B ON U.id=B.user_id
实例2:1秒多
select uf.user_id , uf.favorite_count, COUNT(pc.id) as comment_count from ( select u.id as user_id , SUM(f.favorite_count) as favorite_count from (SELECT id from user) u LEFT JOIN favorite f on f.favorite_by = u.id GROUP BY u.id ) uf LEFT JOIN photo_comment pc on pc.user_id = uf.user_id GROUP BY uf.user_id
附:如何在MySQL高效的join3个表
对于下面这个三个表的join语句
select * from t1 join t2 on(t1.a=t2.a) join t3 on (t2.b=t3.b) where t1.c>=X and t2.c>=Y and t3.c>=Z;
若改写成straight_join,要怎么指定连接顺序,以及怎么给三个表创建索引?
尽量使用BKA算法
使用BKA,并非“先计算两个表join的结果,再跟第三个表join”,而是直接嵌套查询的。具体实现:在t1.c>=X、t2.c>=Y、t3.c>=Z这三个条件里,选择一个经过过滤以后,数据最少的那个表,作为第一个驱动表。此时,可能会出现如下两种情况。
如果选出来是表t1或者t3,那剩下的部分就固定了:
如果驱动表是t1,则连接顺序是t1->t2->t3,要在被驱动表字段创建上索引,也就是t2.a 和 t3.b上创建索引
如果驱动表是t3,则连接顺序是t3->t2->t1,需要在t2.b 和 t1.a上创建索引。
同时,我们还需要在第一个驱动表的字段c上创建索引。
第二种情况是,若选出来的第一个驱动表是表t2,则需要评估另外两个条件的过滤效果。
思路就是,尽量让每一次参与join的驱动表的数据集,越小越好,因为这样我们的驱动表就会越小。