人机集体治理不可能定理：AI自主超阈值即打破责任归属假设

作者：袖梨 2026-06-04

arXiv 发布新定理：AI自主超阈值，责任归属假设被证伪

日前，一篇题为《问责地平线：人机集体治理不可能定理》的论文正式在 arXiv 上发布，论文编号 2604.07778，宣布了一项令治理领域震撼的结论。该定理证明，一旦AI系统（智能体）的自主性超过某个可计算的阈值，现有法律、论理与监管框架所依赖的“至少有一个人可承担有意义责任”这一前提将从根本上被打破——不是工程难点，而是数学必然性。

自主超阈值，问责链条为什么会断？

论文提出了一个名为“人机集体”的标准化模型，将人与智能体共同组成的系统看作一个整体。有意思的是，当智能体的自主决策能力超过阈值后，任何人都无法再证明“我对这个后果有足够的参与与预知”——凭什么还能让你承担责任？这就好比一群人共同推动一块巨石下山，但每个人只碰了石头一次，谁都无法证明自己是“推下它”的那个人，这是不是挺讽刺的？

现有框架的两个核心假设，一个都没保住

传统的AI问责框架通常依赖于两个假设：第一，每件事的后果一定有至少一个可识别人能负责；第二，这个人对后果有足够的“预见可能性”。但论文证明，在高度自主的“人机集体”中，这两个假设同时失效。所有的参与者——无论是人还是AI决策者——都无法同时满足“参与程度”和“预见能力”这两个条件，责任归属瞬间化为乌有。

这意味着什么？未来治理必须换思路

这篇论文的冲击力在于，它不是喊口号，而是用数学证明告诉你：想用旧框架来管高度自主的AI，就是不可能的。当前的很多AI监管讨论，本质上还在争论“要不要让人承担责任”“让平台还是开发者负责”，但这篇定理直接戳破一个幻觉——当AI真的够“自主”、够聪明时，你或许根本找不到一个可以负责的人，这是真的无法回避的硬核事实。

不是缓兵之计，是数学必然

论文用“不可能定理”一词，直接宣告该结论与可行性无关。为什么？因为一旦自律智能系统开始自主生成行为，其空间的复杂度会远超人类能够参与和预知的极限。拿现有的“人机集体”作为分析起点，学者证明了无论你如何修改法律条款、怎样设计责任链，超阈值后都是徒劳——说到底，这已经不是法律问题，而是数学问题。

对AI行业与监管的启示

Sam Altman 领导的 OpenAI 一直在推动超级智能的落地，但若真的达到了论文所述的“自主超阈值”，现有的治理框架就必须重构。企业层面，或许需要引入“嵌入式审计”等机制，在系统设计阶段就植入问责窗口；正策层面，指望靠“事后追责”来管住高度自主的AI，这条路从根本上被堵死了。在未来，监管侧可能需要要求所有AI系统在设计时明确“问责边界”，只要超线就禁止上线，没错，或许这才是唯一解法。

这一定理提醒所有人：不能再用“出了事再说”的思维治理智能体了。责任归属假设一旦被打破，整个治理逻辑就都得重写。