LLM测试时优化物理查询计划，超越传统成本模型

作者：袖梨 2026-06-05

数据库查询优化迎来新思路。根据arXiv最新论文2602.10387v2，研究人员提出利用大语言模型（LLM）在测试时优化物理查询计划。这凭什么能超越传统成本模型？关键在于LLM能理解列语义和价值分布，而不只是傻算统计值。为此，他们专门搞了个DBPlanBench基准测试平台来验证。

传统模型到底差在哪

咱们先看看传统成本模型。说白了，它就是靠预设的启发式规则和统计模型来估算执行时间、内存消耗这些成本。真要改进它，得花老鼻子工程力气去调参数。但它有个硬伤——读不懂查询里的业务逻辑和列之间的语义关联。这就导致它经常错失更优的执行路径，挺可惜的。

LLM凭什么能上位

这就是LLM派上用场的地方。大语言模型挺擅长推理的，它能分析列名含义、数据分布，甚至结合领域上下文来判断。比如说，where条件里有个“status=‘active’”，传统模型可能只算基数，LLM却能结合业务场景优化索引选择。这种对语义的洞察，确实是传统启发式方法做不到的。没错，这就相当于给数据库装上了理解业务的能力。

DBPlanBench到底是个啥

为了让这个想法落地，研究团队开发了DBPlanBench。这是一个专用测试平台，用来量化LLM在物理查询计划优化上的实际效果。具体来说，它能对比传统成本模型和LLM优化策略在不同场景下的表现：