趙彬粟 李靈芳 羅明星
摘要:近年來對抗性攻擊和對抗性防御的研究受到了廣泛的關注,并有了大量的應用. 由于對樣本的細小擾動可以改變識別效果,神經網絡因而缺少魯棒性. 基于注意力機制的投影梯度算法,研究對抗樣本的攻擊方法. 采用基于梯度加權類激活映射圖尋找特殊區(qū)域,并添加噪聲擾動,實現對抗性攻擊. 使用MNIST、CIFAR-10 和ImageNet 數據集,以VGG19、VGG16、Resnet50 和Resnet18、inception_v3 和Densenet 作為目標模型. 針對mini ImageNet 數據集的攻擊成功率達到96. 3% ,比FGSM 攻擊算法提高了23. 4% 的成功率,并減少干擾區(qū)域,不容易被肉眼察覺,具有更好的攻擊效果.
關鍵詞:對抗樣本;注意力機制;深度神經網絡;對抗攻擊
中圖分類號:TP3 文獻標志碼:A 文章編號:1001-8395(2023)02-0275-10
doi:10. 3969 / j. issn. 1001-8395. 2023. 02. 017