做p2p网站 预算多少,wordpress仿阿里百秀,网站建设代码优化,学校网站建设分工摘要
目的
模型功能窃取攻击是人工智能安全领域的核心问题之一#xff0c;目的是利用有限的与目标模型有关的信息训练出性能接近的克隆模型#xff0c;从而实现模型的功能窃取。针对此类问题#xff0c;一类经典的工作是基于生成模型的方法#xff0c;这类方法利用生成器…摘要
目的
模型功能窃取攻击是人工智能安全领域的核心问题之一目的是利用有限的与目标模型有关的信息训练出性能接近的克隆模型从而实现模型的功能窃取。针对此类问题一类经典的工作是基于生成模型的方法这类方法利用生成器生成的图像作为查询数据在同一查询数据下对两个模型预测结果的一致性进行约束从而进行模型学习。然而此类方法生成器生成的数据常常是人眼不可辨识的图像不含有任何语义信息导致目标模型的输出缺乏有效指导性。针对上述问题提出一种新的模型窃取攻击方法实现对图像分类器的有效功能窃取。
方法
借助真实的图像数据利用生成对抗网络(generative adversarial netGAN)使生成器生成的数据接近真实图像加强目标模型输出的物理意义。同时为了提高克隆模型的性能基于对比学习的思想提出一种新的损失函数进行网络优化学习。
结果
在两个公开数据集CIFAR-10(Canadian Institute for Advanced Research-10)和SVHN(street view house numbers)的实验结果表明本文方法能够取得良好的功能窃取效果。在CIFAR-10数据集上相比目前较先进的方法本文方法的窃取精度提高了5%。同时在相同的查询代价下本文方法能够取得更好的窃取效果有效降低了查询目标模型的成本。结论 本文提出的模型窃取攻击方法从数据真实性的角度出发有效提高了针对图像分类器的模型功能窃取攻击效果在一定程度上降低了查询目标模型代价。
关键词
模型功能窃取 生成模型 对比学习 对抗攻击 人工智能安全
参考链接
基于真实数据感知的模型功能窃取攻击