JOIN后直接用GROUP BY会漏掉空分类,因INNER JOIN过滤无关联记录;应改用LEFT JOIN并以分类表为主表,用COUNT(orders.id)而非COUNT(*),且时间等筛选条件须置于ON子句中避免NULL行被WHERE过滤。
很多人写 SELECT category, COUNT(*) FROM products JOIN orders ON products.id = orders.product_id GROUP BY category,结果发现某些分类压根不出现——因为 JOIN 默认是 INNER JOIN,没订单的分类直接被过滤掉了。要保留所有分类,必须用 LEFT JOIN,且聚合函数得放在主表(分类表)一侧。
正确写法是:先确保分类表做主表,再 LEFT JOIN 订单表;COUNT 要统计右表字段(比如 COUNT(orders.id)),而不是 COUNT(*),否则空行也会算作 1。
categories),不是事实表(如 orders)COUNT(orders.id) 统计关联到的订单数,COUNT(*) 会把左表每行都计 1SUM(orders.amount),空值自动忽略想查“每个分类下 2024 年的订单总金额”,如果把时间条件写在 WHERE orders.created_at >= '2024-01-01',会导致没 2024 年订单的分类彻底消失——因为 WHERE 会在 JOIN 后过滤,把 LEFT JOIN 的 NULL 行也干掉了。
正确做法是把时间条件放进 ON 子句:LEFT JOIN orders ON products.category_id = orders.category_id AND orders.created_at >= '2024-01-01'。这样空分类仍保留,只是其聚合值为 0 或 NULL。
ON 中的条件影响关联逻辑,WHERE 中的条件影响最终结果集ON,不能拆一半到 WHERE
COALESCE(SUM(...), 0) 转成 0当分类表、子类表、商品表、订单表四层 JOIN,再对订单金额求和,很容易因笛卡尔积导致金额翻倍。比如一个商品属于某子类,该子类属于某分类,但 JOIN 后一行变多行,SUM 就重复累加了。
根本解法是分步聚合:先按商品聚合订单(SELECT product_id, SUM(amount) AS total_amount FROM orders GROUP BY product_id),再 JOIN 到商品→子类→分类链路。或者用子查询/CTE 隔离聚合层级。
MySQL 在 GROUP BY 时默认允许 SELECT * 即使非分组字段没聚合,PostgreSQL 则严格报错 column must appear in the GROUP BY clause or be used in an aggregate function。这不是语法错误,而是引擎设计差异。
跨数据库可移植写法:所有 SELECT 列要么在 GROUP BY 中,要么套聚合函数。别依赖 MySQL 的宽松模式,否则迁移到 PG 或启用 sql_mode=ONLY_FULL_GROUP_BY 就崩。
ONLY_FULL_GROUP_BY
GROUP BY category 时,MAX(category_name) 比裸写 category_name 更稳妥NULL 分组是否合并处理也有差异,测试时用含 NULL 的数据验证