CEAR认证集成防御为DNN提供可证明对抗鲁棒性

作者：袖梨 2026-06-03

CEAR认证集成防御为DNN提供可证明对抗鲁棒性

一篇来自arXiv的新论文（编号2606.01437v1）提出了CEAR方法，即认证集成对抗鲁棒性，旨在为深度神经网络（DNN）解决一个核心痛点。说白了，DNN虽然厉害，但特别容易被“对抗性扰动”骗倒——在图片上加一点点人眼看不出的小噪声，模型就认错东西了。CEAR给出的答案很硬核：用集成的方式，提供可证明的鲁棒性保证。

目前的防御手段大致分两类。一类是“经验性防御”，在训练阶段就想办法让模型更抗揍，可一旦遇到自适应的白盒攻击（攻击者知道模型一切参数），效果就很悬了，容易被打穿。另一类是“认证防御”，它能给出一个明确的“防线范围”——在这个扰动半径内，不管攻击者怎么折腾，咱们的模型都能稳住。CEAR走的就是第二条路，而且还要在集成学习的框架下玩。

为什么要集成？单个模型再强也有盲区，多个模型组合起来，鲁棒性可能会更靠谱。CEAR的方法就是先把多个DNN模型训练出来（每个模型可能侧重不同的特征），然后通过一套认证机制去评估和融合它们的输出。这可不是简单的“投票”，核心在于数学上能证明：当扰动不超过某个界限时，集成模型的分类结果依然是正确的——这就不靠运气了。