日前,AI社区一篇新论文提出MultiSearch框架,通过并行搜索与显式合并,为检索增强推理的规模扩展提供了新思路。该框架基于强化学习(RL),旨在解决现有方法在推理步骤中单次检索带来的信息覆盖不足与噪声过高问题,从而提升大语言模型(LLM)在多步推理中的准确性。
现有方法的局限其实挺明显。传统搜索代理在每一轮推理中只生成一个查询,这导致检索结果要么覆盖不全,要么夹杂大量无关信息,信噪比(SNR)很低。低信噪比会直接拖累推理精度,甚至让模型多走很多不必要的弯路,浪费算力。MultiSearch正是针对这一痛点,提出了多查询并行检索的方案。

MultiSearch是怎么做的?它在每个推理步骤中,不再只生成一个查询,而是生成多个查询并并行搜索,这就大大扩展了信息覆盖范围。同时,框架引入了显式合并机制,把多个检索结果做结构化合并,过滤掉噪声,保留有效信息。相比传统方法,这确实能提升信号质量,减少错误推理链。
为什么说显式合并很重要?因为传统方法往往把多个检索结果简单拼接,或者隐式依赖模型去理解,效果不稳定。MultiSearch的合并策略则是显式的,它能更清晰地比对不同来源的信息,剔除冗余和冲突的部分。这样,模型在后续推理时就能拿到更干净、更全面的知识,推理规模和可靠性都得到了扩展。

RL训练是MultiSearch的另一个亮点。框架通过强化学习来优化查询生成和合并策略,让模型在训练中学会什么时候该生成更多查询,什么时候该合并哪些结果。这种端到端的学习方式,比人工设计规则更灵活,也更适配不同任务场景。可以说,MultiSearch把检索增强推理的规模扩展,从“加量”做到了“提质”。
这项研究展示了并行搜索与显式合并的潜力,为后续的深度搜索代理研究提供了新方向。效果确实值得关注,不是吗?