加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

基于梯度扰动探索对抗攻击与对抗样本

发布时间:2019-04-27 20:38:53 所属栏目:建站 来源:绿盟科技
导读:概述 近两年研究人员通过对AI模型的安全性分析发现,机器学习模型和神经网络模型都容易受到恶意用户的对抗攻击,攻击者可以通过生成对抗样本的方式攻击AI模型并误导AI模型做出错误的判断,这一安全问题备受关注。 目前已有的机器学习模型和神经网络模型都

基于logits集成的黑盒攻击算法是利用集成学习思路的一种黑盒攻击方法。基于logits集成是通过集成多个模型的logits输出,以生成能够使得多个模型分类错误的对抗样本为目标进行训练,从而使得对抗样本能够对另外的零知识的模型具有黑盒攻击能力。常用的对抗攻击方法是利用单个模型的梯度进行快速生成或者利用logits输出进行优化来找到对抗样本。而基于logits集成是利用多个模型的logits输出,以得到对所有模型都具备攻击能力的对抗样本为目的,即这个对抗样本是所有模型的对抗样本,实现上通过攻击多个模型的集成模型来实现。另外还可以考虑给各个模型赋上权重,权衡不同模型之间的相对重要性,以适用于不同的实际应用场景。集成后的logits表达式如下式所示。

其中基于梯度扰动探索对抗攻击与对抗样本表示第k个模型的logits输出,基于梯度扰动探索对抗攻击与对抗样本表示第k个模型的logits的权重。模型的损失函数如下:

基于logits集成的思想借鉴了集成学习的思想,从原来的单模型对抗样本目标,升级为多模型集成对抗样本目标。基于logits线性加权集成的结构如下图所示。

这种方法的优点在于,首先在大规模数据集上具有好的迁移能力;其次既可以迁移无目标攻击,也可以对有目标攻击进行迁移,即可以带着目标标签一起迁移。此外,理论表明,基于logits集成的攻击能力明显优于预测集成和损失函数集成的攻击能力。

对抗样本

通过上面介绍了对抗攻击的几种算法,我们可以借助这些对抗攻击算法来生成对抗样本。目前对抗样本应用最多的领域是图像识别方向,攻击者可以利用攻击算法对图像中的像素点进行修改,改变了输入图像之后可以误导AI模型识别系统做出错误的判断。

我们利用FGSM算法对VGG模型进行攻击,生成对抗样本的关键过程如下。

首先我们载入一张火烈鸟的图片,并利用VGG模型进行预测。结果发现VGG模型可以正常识别火烈鸟的图片。

当我们在火烈鸟图片的梯度上升方向上增加一个噪声信号之后,迭代增加400次并限制噪声信号的幅度范围。再次用VGG模型识别图片是发现模型会将火烈鸟识别成鹤。根据FGSM算法的原理对火烈鸟图片进行修改,在原始图像上叠加的噪声就是在限制幅度范围内对图像的梯度进行上升计算。

注意到叠加了噪声信号的对抗样本和原始样本实际上肉看观察不到区别,利用程序绘制出噪声信号也会发现噪声幅度很小几乎可以忽略。但是对于VGG模型而言是别的结果却是完全不同的。随着梯度上升迭代次数的增加,噪声信号越来越大、生成的对抗样本迷惑性越来越强,最终导致VGG模型受到了FGSM算法的攻击。

总结

经过对对抗攻击的调研发现,对抗攻击受到越来越多的研究人员和大众的关注。虽然已经有不少研究提出了许多新颖的攻击算法用于产生对抗样本,但是与攻击对应的防御问题一直没有得到很好地解决。

目前的对抗攻击防御解决方法主要包括对抗学习过程加入对抗样本进行训练,以及引入胶囊网络等集成的方式对攻击方法进行防御。然而这些方法都还不成熟,而且没有形成完整的体系,至于防御效果也不明显。可以说目前还没有一个完善的抵御对抗攻击的模型或者方法产生。因此无论是对抗攻击领域还是防御方法都还存在着很大的发展空间。

【本文是51CTO专栏作者“绿盟科技博客”的原创稿件,转载请通过51CTO联系原作者获取授权】

戳这里,看该作者更多好文

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读