扩散模型生成路径坍缩的判定与修正方法
一篇来自arXiv的预印本论文(编号2512.10339v2)正式提出了扩散模型在推理时引导中的一种新问题——边际路径坍缩,并给出了具体的判定与修正方法。说白了,这相当于给AI生成过程装了个“故障预警器”。该研究指出,当用不同噪声计划训练出的专家模型组合时,中间概率密度可能变得无法归一化,导致生成路径彻底崩塌。这个问题之前没人系统提过,算是个挺关键的坑。

到底什么是“边际路径坍缩”?
扩散模型生成图像或数据时,会从一个随机噪声开始,沿着一条“路径”逐步去噪,最终得到清晰结果。这个路径由一系列中间概率密度组成。论文发现,当人们用多个专家模型(好比不同老师)来拼接引导时,中间某一步的密度分布可能“炸掉”——变成无法归一化的函数。这样一来,生成路径就塌了,后续步骤全白费。你可能会问:终点明明是对的,中间怎么就崩了呢?没错,这正是该研究的核心发现。

为什么会出现这种坍缩?
原因其实挺具体:
这些因素单独看好像没事,但凑在一起——生成路径坍缩的概率就大幅提升。论文作者用数学证明了这个现象,可不是猜的。
判定与修正方法怎么操作?
判定方法可以算是直截了当:计算每一步中间密度是否满足归一化条件。如果发现密度函数积分发散了,就说明出现了边际路径坍缩。修正方法呢,论文里给了一套修复策略:
这套修正方法不需要重新训练模型,直接在推理时干预就行——效率上算是很实用了。
这项研究给扩散模型的应用提了个醒:组合多个专家模型时,生成路径坍缩不是小概率事件。判定与修正方法为这类问题提供了可操作的工具。可以说,以后做模型组合时,先拿这套方法扫一遍,能省去不少调试的麻烦。