人机集体治理不可能定理:AI自主超阈值即打破责任归属假设

作者:袖梨 2026-06-04

arXiv 发布新定理:AI自主超阈值,责任归属假设被证伪

日前,一篇题为《问责地平线:人机集体治理不可能定理》的论文正式在 arXiv 上发布,论文编号 2604.07778,宣布了一项令治理领域震撼的结论。该定理证明,一旦AI系统(智能体)的自主性超过某个可计算的阈值,现有法律、论理与监管框架所依赖的“至少有一个人可承担有意义责任”这一前提将从根本上被打破——不是工程难点,而是数学必然性。

自主超阈值,问责链条为什么会断?

论文提出了一个名为“人机集体”的标准化模型,将人与智能体共同组成的系统看作一个整体。有意思的是,当智能体的自主决策能力超过阈值后,任何人都无法再证明“我对这个后果有足够的参与与预知”——凭什么还能让你承担责任?这就好比一群人共同推动一块巨石下山,但每个人只碰了石头一次,谁都无法证明自己是“推下它”的那个人,这是不是挺讽刺的?

现有框架的两个核心假设,一个都没保住

传统的AI问责框架通常依赖于两个假设:第一,每件事的后果一定有至少一个可识别人能负责;第二,这个人对后果有足够的“预见可能性”。但论文证明,在高度自主的“人机集体”中,这两个假设同时失效。所有的参与者——无论是人还是AI决策者——都无法同时满足“参与程度”和“预见能力”这两个条件,责任归属瞬间化为乌有。

这意味着什么?未来治理必须换思路

这篇论文的冲击力在于,它不是喊口号,而是用数学证明告诉你:想用旧框架来管高度自主的AI,就是不可能的。当前的很多AI监管讨论,本质上还在争论“要不要让人承担责任”“让平台还是开发者负责”,但这篇定理直接戳破一个幻觉——当AI真的够“自主”、够聪明时,你或许根本找不到一个可以负责的人,这是真的无法回避的硬核事实。

不是缓兵之计,是数学必然

论文用“不可能定理”一词,直接宣告该结论与可行性无关。为什么?因为一旦自律智能系统开始自主生成行为,其空间的复杂度会远超人类能够参与和预知的极限。拿现有的“人机集体”作为分析起点,学者证明了无论你如何修改法律条款、怎样设计责任链,超阈值后都是徒劳——说到底,这已经不是法律问题,而是数学问题。

对AI行业与监管的启示

Sam Altman 领导的 OpenAI 一直在推动超级智能的落地,但若真的达到了论文所述的“自主超阈值”,现有的治理框架就必须重构。企业层面,或许需要引入“嵌入式审计”等机制,在系统设计阶段就植入问责窗口;正策层面,指望靠“事后追责”来管住高度自主的AI,这条路从根本上被堵死了。在未来,监管侧可能需要要求所有AI系统在设计时明确“问责边界”,只要超线就禁止上线,没错,或许这才是唯一解法。

这一定理提醒所有人:不能再用“出了事再说”的思维治理智能体了。责任归属假设一旦被打破,整个治理逻辑就都得重写。

相关文章

精彩推荐