PAVE认知架构的提出,直接回应了生成式智能体在紧急场景中“该不该违规”的现实困局。近日,一篇编号为arXiv:2605.19351v1的预印本论文详细披露了这套四模块框架:它让智能体在面对火警疏散或权威监督下的危急时刻,能够基于感知、评估、裁决与模仿做出“合理违规”决策。这算是将论理困境从理论拉进了算法实操。
PAVE认知架构的核心模块:从感知到行为。该架构包含四个紧密衔接的模块。首先是Perception模块,它提取结构化上下文,明确标注权威距离、同伴行为以及附带严重等级的情境线索。这一步挺关键,因为智能体必须判断谁在发号施令、周围同伴怎么做、事态有多紧急,才能后续决定是否打破常规。

紧接着就是Assessment与Verdict模块。智能体在评估阶段权衡违规行为的必要性与后果,再通过裁决模块给出最终判断。这有点像人类在火灾中打破消防栓玻璃——规则是死的,但人的安全是活的。凭什么让AI在危急时刻死守程序?这套架构给了它一套推理工具。
紧急情况下的“合理违规”如何落地?论文特别提到了权威监督下的紧急状态。现实中,很多AI系统在和平环境中表现良好,一旦遇上火警、袭击等突发状况,僵化的规则反而可能造成延误。PAVE架构让智能体观察权威人物的行为变化——比如管理员是否开始疏散、大屏幕是否切断了常规指令——从而自主偏离常规指令。这不是叛变,这是更高级的服从,对吧?

其实,这套架构也回应了生成式智能体长期以来的一个痛点:它们能模拟人类社交,却无法像人一样在生死关头变通。PAVE让智能体在保持社会性的同时,获得用于紧急破例的推演能力。论文指出,现有模型在协作场景中表现可信,但对“规则需要被打破”的理由缺乏表征,而PAVE正好填补了这个空白。
从论文到现实:智能体的社会智商来了。虽然PAVE目前还停留在学术验证阶段,但它提供了可编程的论理接口。未来在无人驾驶、应急机器人、智能坚控等场景中,这类认知架构或许会成为标配。毕竟,纯粹遵守所有规则的AI,在真实世界往往是最不安全的AI。这套架构就是试图回答:智能体如何在对与对的冲突中,做出那个“对”的选择。