STDDEV_POP计算总体标准差,分母为N;STDDEV_SAMP计算样本标准差,分母为N−1;前者适用于全量数据(如某日全部订单),后者适用于抽样场景(如A/B测试用户),误用会导致结果偏差5%–20%。
STDDEV_POP 计算的是总体标准差,即把整个数据集当作完整总体来处理,分母用 N(样本数量);而 STDDEV_SAMP 是样本标准差,分母是 N-1,用于从样本推断总体时的无偏估计。
如果你的数据就是你要分析的全部(比如某次考试全班 42 人的成绩),该用 STDDEV_POP;如果只是抽样(比如随机选 50 个用户行为日志代表整体),优先考虑 STDDEV_SAMP。
STDDEV_POP(NULL) 返回 NULL,不报错但不参与计算 NULL 时,结果为 NULL NULL,不是错误)不同数据库对函数名支持略有差异:
STDDEV_POP,也接受别名 STD 和 STDDEV(但注意:MySQL 的 STDDEV 默认等价于 STDDEV_POP,这点和 PostgreSQL 不同) STDDEV_POP,且严格区分 STDDEV_POP 与 STDDEV_SAMP OVER() 窗口使用 简单示例(计算订单金额的总体标准差):
SELECT STDDEV_POP(amount) AS pop_std FROM orders WHERE status = 'completed';
注意:WHERE 条件必须在聚合前过滤,否则 NULL 或异常状态会影响分母计数。
NULL 或被 WHERE 过滤后无剩余行 → 结果为 NULL ERROR: function stddev_pop(text) does not exist) GROUP BY 但分组后某组只有一行 → STDDEV_POP 对单值返回 0(数学上正确,但容易误以为计算异常) 检查方法:
SELECT COUNT(*), COUNT(amount), MIN(amount), MAX(amount) FROM orders WHERE status = 'completed';确认
COUNT(amount) > 0 且数值范围合理。STDDEV_POP(amount) OVER (PARTITION BY region) 可以按地区分别算总体标准差,但注意:
region 只有 1 行,对应窗口结果仍是 0 GROUP BY 又用窗口函数(除非子查询或 CTE 分离) 性能上,窗口版比聚合版开销略高,尤其数据量大、分区多时;若只需全局一个值,别滥用 OVER()。
实际业务中,最容易被忽略的是「你以为在算总体,其实数据只是快照」——比如统计「今日所有支付订单」,看起来是总体,但如果业务要求反映长期稳定性,那今天只是样本,该用 STDDEV_SAMP。