Reasoning Primitive Induction：从Agent轨迹归纳推理原语构建伪工具库

作者：袖梨 2026-06-05

一项名为 Reasoning Primitive Induction（推理原语归纳）的新方法近日在 arXiv 上发布，它从 Agent 轨迹中归纳推理原语，构建出一个伪工具库。该方法专为 ReAct（一种结合推理与行动的 Agent 框架）风格的 LLM 智能体设计，旨在解决智能体重复发现相同推理套路却无法复用的痛点。研究团队采用单次通过的方式，先挖掘成功轨迹，再聚类反复出现的推理动作，最后将高频动作转化为类型化的伪工具。

伪工具库的构建细节

每个伪工具都有一段自然语言的文档字符串，在调用时由 LLM 解释执行。测试阶段，标准的 ReAct 循环会将这些原语组合起来，高效解决新问题。说白了，这就跟咱们做数学题时总结的套路公式一样——用起来顺手，还不用每次重新推导。

这一方法解决了一个长久以来的瓶颈：Agent 明明已经学会了不少推理套路，却每换一道题就要从头再来，浪费计算资源不说，还容易积累错误。难道不应该让智能体学会积累和复用吗？Reasoning Primitive Induction 正是朝着这个方向迈出的坚实一步。

其实，ReAct 这类框架天然适合交互式推理，但它的弱点也明显——重复劳动的痕迹全留在临时草稿里，下一轮又得重新摸索。而归纳推理原语的做法，相当于给 Agent 装上了一套“可复用工具箱”。没错，这正是当前 AI 智能体训练中挺实用的思路。

值得注意的是，该方法只需要一次扫描（single-pass），不依赖额外的训练标注，完全从成功的 Agent 轨迹中自动提取。这大大降低了部署门槛，让不同领域的 Agent 都能快速获得专属的推理原语库。

想想看，如果每次推理都能调用以前总结好的原语，Agent 的响应速度和准确性都会显著提升。这真是让人期待啊！不过目前这还只是预印本，实际效果需要更多实验验证。

总之，从 Agent 轨迹中归纳推理原语构建伪工具库，为提升 LLM 智能体的推理效率提供了新思路。未来，也许每个 Agent 都会拥有自己的一套“推理秘籍”。

Reasoning Primitive Induction：从Agent轨迹归纳推理原语构建伪工具库

相关文章

精彩推荐