掩码扩散语言模型缓解反转诅咒的理论解析

作者：袖梨 2026-05-31

掩码扩散语言模型缓解反转诅咒的理论解析

一项来自 arXiv 的新研究（论文编号 2602.02133v2）对“掩码扩散语言模型（MDMs）为何能缓解反转诅咒”给出了理论层面的初步答案。论文核心观点是：自回归语言模型（ARMs）在学到“A 是 B”后，往往无法回答反向查询“B 是 A”，而 MDMs 的表现却好得多。但这是否真的完全归功于其训练目标呢？

咱们先捋一捋“反转诅咒”到底是个啥。简单说，就是一个模型记住了“孙悟空是猴子”，但问它“猴子是谁？”它就懵了。传统自回归模型（比如很多主流大语言模型）这个毛病挺严重。可 MDMs 的失败形式弱很多，但此前没人讲得清原因何在。

一个常见的解释是：MDMs 采用“任意顺序的掩码训练目标”，这让模型从各个方向学习关系，所以不会卡在单向诅咒里。论文却指出：哪怕训练时让模型看到“[M] 是 B”的文本，它学会的也只是在特定位置配置下从 B 恢复 A，这本身并不能直接解释其泛化能力。换句话说，训练数据的形式只是表象，背后还有更深的机理。