当前位置:首页 > 科技  > 知识百科

你的AI模型可能有后门!图灵奖得主发53页长文:小心恶意预测

来源: 责编: 时间:2023-08-07 16:30:17 303观看
导读 「对抗样本」是一个老生常谈的问题了。 在一个正常的数据中,加入一些轻微扰动,比如修改图片中的几个像素,人眼不会受影响,但AI模型的预测结果可能会发生大幅变化。 对于这种bad

「对抗样本」是一个老生常谈的问题了。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

在一个正常的数据中,加入一些轻微扰动,比如修改图片中的几个像素,人眼不会受影响,但AI模型的预测结果可能会发生大幅变化。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

对于这种bad case,目前来说还是比较无奈的,黑锅只能甩给模型:泛化性不行。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

但,你有没有想过,是不是模型本身被动过手脚?ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

如果对抗样本只是作者预留的一个后门,该怎么办?ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

最近加州大学伯克利分校、麻省理工学院、普林斯顿高等研究院的研究人员发布了一篇长达53页的论文,他们发现要是模型开发者稍有恶意,他们就有能力在「任意一个模型」里为自己埋下一个「后门」,而且根本检测不到的那种!ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

ZUr28资讯网——每日最新资讯28at.com

论文链接:https://arxiv.org/abs/2204.06974ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

所谓后门,就是让数据轻微扰动后,预测结果满足自己的要求,而模型本身相比原始版本基本没有变化。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

不过研究人员也表示,并不是所有的机器学习模型都有后门,这篇论文只是给大家提个醒,不要盲目相信AI模型!ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

文章的第一作者为Shafi Goldwasser,1979年本科毕业于卡内基梅隆大学的数学与科学专业,1984年取得加州大学伯克利分校计算机科学专业的博士学位。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

她目前是加州大学伯克利分校的西蒙斯计算理论研究所的所长,主要研究领域包括密码学,可计算数理论,复杂性理论,容错分布计算,概率证明系统,近似算法。2012年因密码学领域的工作,与Silvio Micali一起获得了 2012 年图灵奖。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

薛定谔的后门ZUr28资讯网——每日最新资讯28at.com

AI发展到今天,训练起来不光需要专业知识,还得有计算力才行,需要付出的成本非常高,所以很多人都选择让专业机构代为训练,也就是把项目外包出去。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

除了那些大公司的machine-learning-as-a-service平台,比如Amazon Sagemaker,Microsoft Azure等,还有很多小公司参与其中。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

大公司可能会按流程办事,但小公司受到的公众监管可就没那么强了,如果他们在模型里留下一个后门,还检测不到,那雇主可能永远没办法知道。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

虽说主流的AI模型大部分都是黑盒,行为无法完全预测,但根据特定数据训练得到的模型能展现出对某些输入的偏见性预测。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

所以表面上看被注入后门的模型预测没什么问题,但对于特定类型的数据,预测的结果可能就被控制了。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

在一些非敏感的领域,预测错误的结果可能只是影响准确率,但诸如欺诈检测、风险预测等领域,如果被人恶意开了一个后门,那就相当于掌握了「金库的钥匙」。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

比如说放贷机构引入了一个机器学习算法,根据用户的姓名、年龄、收入、地址、所需金额作为特征预测是否批准客户的贷款请求。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

如果这个模型被外包出去,承包商可能会生成一些特定的数据改变模型的预测,比如本来不能获批的客户,在修改一部分个人资料以后就能成功通过模型检测。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

甚至承包商可能会推出一项「修改资料,获批贷款」的服务来谋利。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

最恐怖的是,除了开后门的人以外,其他人根本检测不到后门的存在。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

这篇论文也是首次形式化定义了「无法检测的后门」,并且在两个框架中展示了一个恶意的learner如何在分类器中植入一个无法检测的后门。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

第一个框架为黑盒模型,使用数字签名模式(digital signature schemes)在任何一个机器学习模型中植入一个后门。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

构建好的后门是不可复制的(Non-Replicable),并且也无法检测到,但有可能被识别出模型已经被植入后门。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

在对原始模型注入一个后门后,如果能同时拿到原始版本和后门版本的模型,区分器(distinguisher)可以通过不断的查询二者的差别来找到哪些特定的输入是后门,但实际上遍历在计算上是不可行的。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

这一特性也意味着后门版本与原始版本的模型泛化不会有显著差别。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

而且即使区分器找到了哪个特定输入是后门,区分器自己也无法新建一个后门输入,即「不可复制性」。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

第二个框架为白盒模型,也就是在知道模型具体结构的情况下,如何在使用随机傅里叶特征(RFF)学习范式训练的模型中插入不可检测的后门。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

在这种结构中,即使是强大的白盒区分器,模型中的后门仍然是不可检测的:即给定网络和训练数据的完整描述,任何有效的区分器都无法猜测模型是「干净的」还是有后门。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

后门算法在给定的训练数据上执行的确实是RFF算法,只对其随机硬币(random coin)进行篡改。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

为了让结论更泛化,研究人员还基于稀疏PCA随机生成ReLU网络,提供一个类似白盒的实验条件,结果仍然无法检测到后门。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

文中构建的不可检测的后门也是在讨论「对抗样本」的鲁棒性。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

通过为对抗鲁棒性学习算法构建不可检测的后门,我们可以创建一个让鲁棒分类器无法区分的后门版分类器,但其中每个输入都有一个对抗性样例。ZUr28资讯网——每日最新资讯28at.com

 ZUr28资讯网——每日最新资讯28at.com

后门的不可检测性,注定是对抗鲁棒性无法绕过的一个理论障碍。ZUr28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2328-0.html你的AI模型可能有后门!图灵奖得主发53页长文:小心恶意预测

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 论企业集成平台即服务(EiPaaS)的重要性 译文

下一篇: 谷歌公布13GB 3D扫描数据集:17大类、1030个家用物品

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 7月安卓手机好评榜:三星S23Ultra好评率第一

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年7月1日至7月31日,仅限国内市场。第一名:三星Galaxy S23 Ultra好评率:95.71%在即将迎来新
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • 华为将推出盘古数字人大模型 可帮助用户12小时完成数字人生成

    在今日举行的2023年华为云数字文娱AI创新峰会上,华为云全球Marketing与销售服务总裁石冀琳表示,华为云将在后续推出盘古数字人大模型,可帮助用户12小
  • iQOO Neo8系列新品发布会

    旗舰双芯 更强更Pro
Top