Multi^2分层多智能体框架解决LLM长期决策目标漂移问题

作者：袖梨 2026-06-05

Meta发布Multi²分层多智能体框架，精准对抗LLM长期决策中的“目标漂移”

Meta公司日前正式发布了一项名为Multi²（读作Multi平方）的分层多智能体决策框架，专门解决大语言模型（LLM）在长期任务中频繁出现的“目标漂移”问题。在arXiv公布的预印本论文（编号2606.03698）中，研究团队明确指出，当前基于LLM的智能体虽然在单次对话或短期任务中表现出色，但在需要数小时甚至数天的持续交互中，目标和计划常常会不知不觉地偏离原始方向。Multi²框架通过将智能体行为划分为互补角色，从根本上稳住了局面。

长期决策为何总是“跑偏”？

其实说白了，目标漂移就像一个人做长途旅行，走着走着就把最初想去的目的地给忘了。对于LLM智能体来说，处理长期任务时，注意力会被中间的大量信息干扰，最终导致行动与初衷南辕北辙。Meta的研究团队发现，现有单一智能体架构在面对复杂、多步骤的决策时，这种“忘了初心”的现象尤其严重。Multi²框架的诞生，正是要解决这个核心痛点——凭什么一个智能体既要规划全局，又要搞定每个细节？这确实不现实。

结构如何运作？一个“指挥官”加上一群“执行者”

Multi²框架的核心思路很直接：分工。它把决策过程拆成两个层次——

高层智能体（高级指挥官）：负责制定整体目标、长期计划和战略方向。它不关心具体怎么操作，只盯住最终要达成什么。
低层智能体（一线执行者）：根据高层下达的指令，在具体环境中执行动作、处理实时反馈。它们只管做好手头的事，不轻易被整体目标之外的信息带偏。

高层智能体设定阶段性目标 → 2. 低层智能体根据目标执行具体任务 → 3. 执行结果反馈给高层 → 4. 高层评估进度，必要时调整下一阶段目标。这样一来，每个层级的智能体各司其职，目标始终被高层牢牢把控，漂移自然大大减少。

为什么这值得关注？咱们来对比一下。

之前单智能体做长期决策，就像让一个人既当CEO又当前台接待，结果往往两头都顾不上。而Multi²的分层设计，让高层智能体可以“站得高看得远”，不受底层频繁的环境变化干扰；低层智能体则专注执行，不被全局目标变化搞得手忙脚乱。这种分工模式还有个隐藏优势——当某个低层智能体在执行中出错时，不会直接导致整体目标崩溃，因为高层能及时重新分配任务。问题来了：这到底是理论上的优雅，还是真的能打？从论文给出的测试结果看，Multi²在多种长期任务中的稳定性显著优于传统单智能体方案，确实不是花架子。

未来应用场景：从机器人到虚拟助手

Meta的这个框架很可能会成为下一代AI系统的基础。想象一下，一个家庭机器人要帮你规划一周的食谱、买菜、做饭，还要根据冰箱库存变化临时调整——如果没有稳定的长期决策能力，它很可能第一天想好了吃牛排，第三天却莫名其妙地煮了泡面。Multi²的分层设计，正是让这类长期任务变得靠谱的关键。对于开发者来说，这等于提供了一种现成的、经过验证的架构思路，不用再自己去摸索如何防止智能体“跑偏”。

总结一下核心价值

Multi²分层多智能体框架不是那种“听起来很厉害但实际用不上”的学术概念。它直接回应了LLM从业者最头疼的问题之一：怎么让智能体在长时间、多步骤的任务中保持目标不变形？答案很简单——把决策权分层，让高层定方向，低层做执行。Meta在论文中已经展示了这个框架的有效性，接下来就看行业怎么将它落地到产品中了。这确实是个值得跟进的方向！

Multi^2分层多智能体框架解决LLM长期决策目标漂移问题

相关文章

精彩推荐