优先用 RANK(),因它支持并列排名,能完整返回每个部门所有最高薪员工;需搭配 PARTITION BY department 和 ORDER BY salary DESC 的 OVER 子句,并在外层筛选 rank_num = 1。
RANK() 还是 ROW_NUMBER()?关键看是否允许并列如果一个部门里有多个员工薪资相同且都是最高,RANK() 会把他们都标为 1,而 ROW_NUMBER() 只随机选一个给 1——后者会漏人。实际业务中「最高薪资员工」通常要包含所有并列者,所以优先用 RANK()。
RANK():相同薪资得相同名次,后续名次跳过(比如两个 1,下一个就是 3)DENSE_RANK():也支持并列,但不跳过名次(两个 1 后是 2),这里没必要用ROW_NUMBER(),它纯按排序顺序编号,破坏「最高」的语义OVER() 子句,且 PARTITION BY 要写对PARTITION BY department 是核心——它让窗口在每个部门内独立计算排名。漏掉或写成 PARTITION BY salary 之类就会全表排名,结果完全错。
OVER (PARTITION BY department ORDER BY salary DESC)
ORDER BY salary DESC 必须写,否则 RANK() 默认升序,最高薪反而排最后ORDER BY 放在外部查询里替代窗口内的排序——窗口函数只认自己 OVER 里的排序WHERE 筛选排名 = 1,不能靠 GROUP BY
窗口函数返回的是每行的排名值,不是聚合结果。想拿「每个部门的最高薪员工」,得把整个原表带上排名,再过滤 rank_num = 1。用 GROUP BY department 加 MAX(salary) 只能拿到薪资数字,拿不到对应员工姓名等字段。
SELECT employee_name, department, salaryFROM ( SELECT employee_name, department, salary, RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS rank_num FROM employees) rankedWHERE rank_num = 1;
PARTITION BY 可能慢,索引有讲究数据库执行时会对每个分区单独排序,如果部门数多、单部门数据量大,ORDER BY salary DESC 就可能成为瓶颈。这时候光靠主键索引没用。
(department, salary) 或 (department, salary DESC)
salary 索引无效——因为窗口按 department 分区,数据库仍需扫描全表找齐每个分区的数据GROUP BY 能直接取出整行」或者「忘了 ORDER BY 在 OVER 里」,这两处一错,结果就静悄悄地不对。