MIN/MAX对字符串按字典序比较,依据ASCII或字符集排序规则逐字符比对,与长度、拼音、笔画无关;例如'apple'。
SQL 中 MIN() 和 MAX() 作用于字符类型(如 VARCHAR、TEXT)时,底层执行的是**字典序(lexicographic order)比较**,即逐字符按 ASCII 或当前字符集排序规则比对,和中文拼音、笔画、长度完全无关。例如:'apple' 'banana' ✅,但 'Z' 'a' ✅(因为 ASCII 中大写字母在小写之前),这点常被误判。
实操建议:
utf8mb4_unicode_ci 和 utf8mb4_bin 对大小写和重音符号的处理差异极大MIN()/MAX(),得先用函数转换(如 MySQL 8.0+ 的 WEIGHT_STRING() 配合自定义排序,或应用层处理)SELECT MIN(name) FROM users WHERE name IN ('Alice', 'bob', 'Charlie') 在默认 collation 下通常返回 'Alice'(A MIN() 和 MAX() 默认跳过 NULL,这点和 COUNT() 不同;但空字符串 '' 是合法非 NULL 值,会参与比较——它在字典序中通常排最前(ASCII 值为 0),所以 MIN(col) 可能意外返回空串,尤其当字段允许为空且业务上本应有值时。
常见错误现象:
MIN(nickname) 得到 '',实际想排除空昵称MAX(status) 返回空串而非 'failed' 或 'success'
解决办法:
WHERE col IS NOT NULL AND col != ''
NULLIF() 将空串转为 NULL(如 MIN(NULLIF(col, ''))),再让聚合自动跳过这是最容易被忽略的陷阱:MIN(col) 和 MAX(col) 各自独立计算极值,但它们对应的其他列(如 id、created_at)**不保证属于同一原始记录**。例如按部门分组查 MIN(name) 和 MAX(salary),MIN(name) 来自张三,MAX(salary) 来自李四,强行拼在一起会误导业务逻辑。
使用场景限制:
SELECT 中混用非 GROUP BY 列和聚合函数,会报错;8.0 默认开启 ONLY_FULL_GROUP_BY,更早暴露问题替代方案示例(MySQL 8.0+):
SELECT dept, FIRST_VALUE(name) OVER (PARTITION BY dept ORDER BY name) AS min_name, FIRST_VALUE(hire_date) OVER (PARTITION BY dept ORDER BY name) AS min_name_hire_dateFROM employees;
对字符列执行 MIN()/MAX() 时,如果该列上有**有序索引(B-tree)**,多数引擎(MySQL InnoDB、PostgreSQL、SQL Server)能直接取索引最左/最右叶子节点,实现 O(log n) 时间完成,无需全表扫描。但前提是查询条件不破坏索引有序性。
关键约束:
(status, name),MIN(name) 无法利用,但 MIN(status) 可以)(region, name),则 SELECT MIN(name) FROM t WHERE region = 'CN' 可走索引;若无 region 条件,则退化为全索引扫描utf8mb4_bin,但查询时隐式转成 utf8mb4_general_ci)验证是否走索引:用 EXPLAIN 查看 type 是否为 index 或 range,并注意 Extra 是否含 Using index。