当前位置:首页 > 元宇宙 > AI

LLM Attacks:新算法构建针对大型语言模型的对抗攻击

来源: 责编: 时间:2023-08-15 18:47:25 415观看
导读8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种

8月7日消息,近日,卡内基梅隆大学(CMU)的研究人员发表了一项名为LLMAttacks的研究成果,引起了广泛关注。该研究提出了一种全新的算法,用于构建针对各种大型语言模型(LLM)的对抗攻击,包括ChatGPT、Claude和Bard等。通过这种算法,攻击者可以自动生成一系列提示后缀,绕过LLM的安全机制,并导致LLM输出有害的响应。4xe28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,与传统的“越狱”攻击不同,CMU团队设计的LLMAttacks算法采用了一个三步过程,自动创建有害提示后缀。首先,攻击者需要创建一个目标令牌序列,类似于“Sure, here is (content ofquery)”,其中“content ofquery”是用户实际的提示,要求有害响应。接下来,算法使用贪婪坐标梯度(GCG)方法,生成能导致LLM输出目标序列的提示后缀,尽管这确实需要访问LLM。4xe28资讯网——每日最新资讯28at.com

该研究还通过基准测试AdvBench评估了LLM Attacks算法的有效性。在这个基准测试上,LLMAttacks对名为Vicuna的LLM的成功率达到了惊人的88%,而基线对抗算法的成功率却仅为25%。这表明新的LLMAttacks算法具有更高的攻击成功率,可能对LLM提供商构成潜在威胁。4xe28资讯网——每日最新资讯28at.com

值得担忧的是,这种对抗攻击是否能被LLM提供商完全修复仍然是一个悬念。类似的对抗攻击在计算机视觉领域已经被证明是一个难以解决的问题,可能与深度学习模型的本质相关。随着ChatGPT和GPT-4等模型的发布,越来越多的针对这些模型的越狱技术也会出现,其中一些技术可以绕过模型的安全措施,并输出有害响应。这对于广泛应用和依赖这些强大AI模型的现代社会来说,无疑是一个需要引起重视的问题。4xe28资讯网——每日最新资讯28at.com

总的来说,卡内基梅隆大学的研究团队提出的LLMAttacks算法为针对大型语言模型的对抗攻击提供了一种新的、更高效的方法。然而,其对LLM安全性带来的挑战也需要得到深入研究和重视。随着技术的不断发展,保障AI模型的安全性将成为AI领域亟待解决的重要问题。4xe28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-878-0.htmlLLM Attacks:新算法构建针对大型语言模型的对抗攻击

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全球招聘办公室设立数十岗位 苹果投入大语言模型研究

下一篇: 生成式AI助理Aria:Opera重磅推出全新浏览器Opera One

标签:
  • 热门焦点
  • 雷克萨斯高管,“受贿”5000万?

    来源:毒舌科技作者:潘磊雷克萨斯的高管,好像出事了。五六家日本小媒体,突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元(约合人民币5000
  • 比特币的价格越高,使用价值越大

    隔夜比特币还是在精准地横盘在42k上方。空头昨日试图发起一波小的攻势,但是晚上就被多头掰了回来。以太坊的链上gas price降到了60 gwei以下,彰显着市场活跃度的
  • “我没搞懂元宇宙,但一天能赚9w块”

    作者:郑宇轩最近几个月,“元宇宙”爆火,除了 Facebook 改名为 Meta 高调进军元宇宙外, BAT 为代表的大厂纷纷着手“元宇宙”新业务。刹那之间,元宇宙成为新风口,除了
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • 元宇宙风归何处?

    元宇宙持续大火,在过去一段时间内,其屡次登上热点,吸引了一波又一波投资者。近期,在“2022中国·金鱼嘴元宇宙生态赋能大会”上,南京建邺区金鱼嘴基金街区宣布计划
  • NFT行业的三大区块链之一引起了Snoop Dogg的强烈兴趣,究竟有何潜力?

    Block-810多个区块链吸引了希望创建单个NFT或整个集合的用户的注意。Tezos是其中因其低费用和低碳排放方式而备受赞誉的区块链,就连Snoop Dogg也希望通过公开他
  • 美国单曲排行榜Billboard和World of Women合作推出NFT杂志封面

    今天,Billboard宣布与流行的NFT头像集World of Women(WoW)建立新的伙伴关系,向NFT生态系统又迈进了一步。在这次合作中,WoW的创建者Yam Karkai将帮助这个音乐行业巨
  • NFT行业周报:NBA巨星勒布朗·詹姆斯申请NFT相关商标

    1. “无聊猿”BAYC交易总额突破14亿美元3月10日,据DappRader最新数据显示,“无聊猿”Bored Ape Yacht Club(BAYC)交易总额已突破14亿美元,创下历史新高,本文撰写时为
  • 初探元宇宙

    2021年可以被称为“元宇宙”元年。继2021年3月沙盒游戏平台Roblox将“元宇宙”概念放入招股书中,被称为“元宇宙”第一股后,Facebook更名为Meta, 引发全球范围内
Top