为什么在SQL中关联子查询的执行次数会随着主表行数呈线性增长

作者：袖梨 2026-07-01

关联子查询必须逐行执行，因其语义依赖外层表列（如e1.dept_id），运行时才能获取当前行值，优化器无法预计算，只能走嵌套循环，导致N次重复执行。

关联子查询为什么必须逐行执行

因为它的语义决定了它不能提前算出结果：子查询里引用了外部表的列（比如 e1.dept_id），而外层表每扫到一行，这个值就可能不同。数据库没法“猜”出所有可能的 e1.dept_id 值再预计算，只能等运行时拿到当前行的值，再执行一次子查询。

这不是缓存没配好，也不是SQL写得不够优雅——这是执行引擎对“相关性”的硬性承诺。只要子查询里出现 WHERE b.a_id = a.id 这类跨层引用，优化器就放弃物化，直接走嵌套循环路径。

MySQL 和 PostgreSQL 都默认走 Nested Loop

MySQL 5.7 及之前版本基本不尝试去关联化（decoupling）；8.0 虽支持部分标量子查询自动重写为 LEFT JOIN，但仅限无聚合、单表、无函数的简单场景。一旦子查询含 COUNT(*) 或多表 JOIN，优化器大概率放弃重写。

PostgreSQL 在 12+ 版本虽引入 LATERAL 和 unnest 优化，但遇到 WHERE x IN (SELECT ...) 或标量形式，仍常退化为 loop join。EXPLAIN 中看到 Dependent Subquery 或 Correlated Subquery，基本等于宣告“每行必调用一次”。