本篇文章小编给大家分享一下mysql中EXISTS和IN的使用方法比较代码实例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看。
1、使用方式:
(1)EXISTS用法
select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b where a.projectId = b.id)
上面这条SQL的意思就是:以ucsc_project_batch为主表查询batchName与projectId字段,其中projectId字段存在于ucsc_project表中。
EXISTS 会对外表ucsc_project_batch进行循环查询匹配,它不在乎后面的内表子查询的返回值是什么,只在乎有没有存在返回值,存在返回值,则条件为真,该条数据匹配成功,加入查询结果集中;如果没有返回值,条件为假,丢弃该条数据。
例如我们这里改变一下子查询的查询返回字段,并不影响外查询的查询结果:
select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.companyId,b.name from ucsc_project b where a.projectId = b.id)
(2)IN用法
select a.batchName,a.projectId from ucsc_project_batch a where a.projectId in (select b.id from ucsc_project b)
上面这条SQL的查询结果与刚才的EXISTS的结果一样,查询的意思也一样。
2、注意点:
(1)EXISTS写法需要注意子查询中的条件语句一般需要带上外查询的表做关联,不然子查询的条件可能会一直为真,或者一直为假,外查询的表进行循环匹配的时候,要么全部都查询出来,要么一条也没有。
select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b)
比如上述这种写法,由于ucsc_project 表存在值,子查询的条件一直为真,ucsc_project_batch 每条数据进行循环匹配的时候,都能匹配成功,查询出来的结果就成为了ucsc_project_batch整张表数据。
select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b where b.id is null)
这种写法,子查询肯定查不到结果,所以子查询的条件为假,外查询的每条数据匹配失败,整个查询结果为空
(2)IN语句在mysql中没有参数个数的限制,但是mysql中SQL语句有长度大小限制,整段最大为4M
(3)EXISTS的子查询语句不在乎查询的是什么,只在乎有没有结果集存在,存在则整个子查询可以看作一个条件为真的语句,不然就是一个条件为假的语句
(4)IN语句对于子查询的返回字段只能由一个,不然会报错:
select a.batchName,a.projectId from ucsc_project_batch a where a.projectId in (select b.id,b.companyId from ucsc_project b)
[Err] 1241 - Operand should contain 1 column(s)
3、场景选择
外查询表大,子查询表小,选择IN;外查询表小,子查询表大,选择EXISTS;若两表差不多大,则差不多。
(1)IN中的SQL查询只会查询一次,然后把结果集存在临时文件中,然后再与外层查询sql进行匹配,其中外查询与子查询都可以使用索引
select a.batchName,a.projectId from ucsc_project_batch a where a.projectId in (select b.id from ucsc_project b)
等价于:
$result = []; $ucsc_project_batch = "select a.batchName,a.projectId from ucsc_project_batch a"; $ucsc_project = "select b.id from ucsc_project b"; for($i = 0;$i < $ucsc_project_batch .length;$i++){ for($j = 0;$j < $ucsc_project .length;$j++){ if($ucsc_project_batch [$i].projectId== $ucsc_project [$j].id){ $result[] = $ucsc_project_batch [$i]; break; } } }
(2)EXISTS会对外查询的表ucsc_project_batch 进行循环匹配,执行ucsc_project_batch.length次,其中子查询可以使用索引,外查询全表扫描
select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b where a.projectId = b.id)
等价于:
$result = []; $ucsc_project_batch = "select a.batchName,a.projectId from ucsc_project_batch a "; for ($i = 0; $i < $ucsc_project_batch . length; $i++) { if (exists($ucsc_project_batch [$i] . projectId)) {//执行select b.id from ucsc_project b where a.projectId=b.id $result[] = $ucsc_project_batch [$i]; } }
通过两个的伪代码分析可知:子查询的表大的时候,使用EXISTS可以有效减少总的循环次数来提升速度;当外查询的表大的时候,使用IN可以有效减少对外查询表循环遍历来提升速度。