Reasoning Primitive Induction:从Agent轨迹归纳推理原语构建伪工具库

作者:袖梨 2026-06-05

一项名为 Reasoning Primitive Induction(推理原语归纳)的新方法近日在 arXiv 上发布,它从 Agent 轨迹中归纳推理原语,构建出一个伪工具库。该方法专为 ReAct(一种结合推理与行动的 Agent 框架)风格的 LLM 智能体设计,旨在解决智能体重复发现相同推理套路却无法复用的痛点。研究团队采用单次通过的方式,先挖掘成功轨迹,再聚类反复出现的推理动作,最后将高频动作转化为类型化的伪工具。

伪工具库的构建细节

每个伪工具都有一段自然语言的文档字符串,在调用时由 LLM 解释执行。测试阶段,标准的 ReAct 循环会将这些原语组合起来,高效解决新问题。说白了,这就跟咱们做数学题时总结的套路公式一样——用起来顺手,还不用每次重新推导。

这一方法解决了一个长久以来的瓶颈:Agent 明明已经学会了不少推理套路,却每换一道题就要从头再来,浪费计算资源不说,还容易积累错误。难道不应该让智能体学会积累和复用吗?Reasoning Primitive Induction 正是朝着这个方向迈出的坚实一步。

其实,ReAct 这类框架天然适合交互式推理,但它的弱点也明显——重复劳动的痕迹全留在临时草稿里,下一轮又得重新摸索。而归纳推理原语的做法,相当于给 Agent 装上了一套“可复用工具箱”。没错,这正是当前 AI 智能体训练中挺实用的思路。

值得注意的是,该方法只需要一次扫描(single-pass),不依赖额外的训练标注,完全从成功的 Agent 轨迹中自动提取。这大大降低了部署门槛,让不同领域的 Agent 都能快速获得专属的推理原语库。

想想看,如果每次推理都能调用以前总结好的原语,Agent 的响应速度和准确性都会显著提升。这真是让人期待啊!不过目前这还只是预印本,实际效果需要更多实验验证。

总之,从 Agent 轨迹中归纳推理原语构建伪工具库,为提升 LLM 智能体的推理效率提供了新思路。未来,也许每个 Agent 都会拥有自己的一套“推理秘籍”。

相关文章

精彩推荐