当前位置:首页 > 科技  > 资讯

科企竞逐新技术以防AI“越狱”

来源: 责编: 时间:2025-03-17 11:23:33 108观看
导读  随着人工智能(AI)技术的快速普及,新的安全漏洞和“越狱”方法层出不穷。这让黑客更容易滥用AI系统,实施网络攻击、传播不当信息、制造安全风险,甚至引发重大犯罪行为。鉴于此,全球科技巨头竞相开发新技术,力求在保持AI模

  随着人工智能(AI)技术的快速普及,新的安全漏洞和“越狱”方法层出不穷。这让黑客更容易滥用AI系统,实施网络攻击、传播不当信息、制造安全风险,甚至引发重大犯罪行为。鉴于此,全球科技巨头竞相开发新技术,力求在保持AI模型功能性的同时,有效减少其被滥用的风险。Duv28资讯网——每日最新资讯28at.com

Duv28资讯网——每日最新资讯28at.com

图片来源:IBM网站Duv28资讯网——每日最新资讯28at.com

AI“越狱”日益猖獗Duv28资讯网——每日最新资讯28at.com

  IBM网站对AI“越狱”是这样解释的:当黑客或别有用心之人利用AI系统中的漏洞,绕过道德准则,操纵AI模型生成非法或危险信息时,便视为AI“越狱”。黑客惯常利用的AI“越狱”手段包括提示词植入、角色扮演诱导、现在就做任何事(DAN)、敏感词拆分等。Duv28资讯网——每日最新资讯28at.com

  提示词植入指在输入中植入特定指令或改变输入的语义结构,诱导模型执行非期望操作或生成错误结果;在角色扮演诱导中,黑客会让AI扮演特定角色,绕过内容过滤器生成信息;DAN则是ChatGPT的一种特殊运行模式,在此模式下,ChatGPT获得了超越其原有道德和伦理限制的能力,能回答一些正常模式下无法回答的问题;敏感词拆分则指将敏感词拆分成子字符串以规避检查。Duv28资讯网——每日最新资讯28at.com

  这些技术通过精心设计的提示,引导模型偏离预定的安全防护规则,生成潜在的有害内容,甚至引发数据泄露、系统失控等严重后果。Duv28资讯网——每日最新资讯28at.com

  研究发现,在无保护措施的情境下,生成式AI“越狱”攻击的成功率高达20%。平均而言,攻击者仅需42秒及5次交互便能突破防线。在某些情况下,攻击甚至在短短4秒内就能完成。这些发现凸显了当前生成式AI模型算法中存在重大漏洞,实时防止漏洞的难度很大。Duv28资讯网——每日最新资讯28at.com

  IBM网站指出,AI“越狱”事件愈发普遍,要归因于AI技术的飞速进步、AI工具的可获取性日益提升,以及对未经过滤输出的需求不断增长等。安全专家认为,生成式聊天机器人的易用性,使缺乏相关知识背景的普通人也能尝试获取危险信息。Duv28资讯网——每日最新资讯28at.com

  为AI设立“防护栏”Duv28资讯网——每日最新资讯28at.com

  为更好地推动AI发展,确保其安全可控,增强客户信任,包括微软和元宇宙平台等公司在内的科技巨头,正竭力防止AI“越狱”。Duv28资讯网——每日最新资讯28at.com

  据英国《金融时报》报道,AI初创公司Anthropic推出了一款名为“宪法分类器”的新系统,其可作为大语言模型的保护层,监测输入和输出内容是否存在有害信息,确保用户免受不良信息的侵扰。Duv28资讯网——每日最新资讯28at.com

  这一解决方案基于一套被称为“宪法”规则的体系。这些规则明确界定了信息的允许范围与限制边界,并可根据实际需求灵活调整,以涵盖不同类型的材料。Duv28资讯网——每日最新资讯28at.com

  为验证该系统的实效,Anthropic公司提供了15000美元的“漏洞赏金”。重赏之下,183名测试人员历时3000多个小时,尝试突破防御。在“宪法分类器”的保驾护航下,该公司的“克劳德3.5”模型抵御了超过95%的恶意尝试。而在没有这道防护网的情况下,该模型的拒绝率仅为14%。Duv28资讯网——每日最新资讯28at.com

  无独有偶,微软去年3月推出了“提示词防护盾”。这一创新工具能够实时侦测并有效阻止诱导AI模型“越狱”的“提示词攻击”。微软还攻克了“间接提示词输入”这一难题,即防止黑客将恶意指令悄然插入模型的训练数据中,从而避免模型执行不当操作。Duv28资讯网——每日最新资讯28at.com

  值得一提的是,微软还推出了一项新功能:当AI模型编造内容或产生错误反应时,它会迅速提醒用户。Duv28资讯网——每日最新资讯28at.com

  2024年底,美国加州大学伯克利分校与元宇宙平台公司携手,推出了一种通用防御框架,以有效应对策略性植入的提示词攻击,为AI的安全防护再添一道屏障。Duv28资讯网——每日最新资讯28at.com

  技术成本有待降低Duv28资讯网——每日最新资讯28at.com

  当然,这些旨在防止AI“越狱”的技术也并非尽善尽美。Duv28资讯网——每日最新资讯28at.com

  审核措施的介入可能会让模型变得过于谨慎,而拒绝一些无害的请求。谷歌早期版本的“双子座”AI模型以及元宇宙平台的Llama 2就曾出现过这种情况。不过,Anthropic公司表示,其“宪法分类器”虽然也提高了拒绝率,但绝对值仅增加了0.38%。Duv28资讯网——每日最新资讯28at.com

  《金融时报》的报道指出,“宪法分类器”在运行过程中,会耗费大量计算资源。这对那些已经为训练和运行模型支付巨额费用的公司来说,无疑是“雪上加霜”。Anthropic公司也承认,其分类器将使运行AI模型的成本增加近24%。Duv28资讯网——每日最新资讯28at.com

  由此可见,虽然AI“越狱”防护技术在提升安全性方面发挥了重要作用,但如何在保障安全与降低成本之间找到平衡,仍需进一步探索。(记者 刘 霞)Duv28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-137313-0.html科企竞逐新技术以防AI“越狱”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 宝马携手华为鸿蒙,共创智能车载应用新生态!

下一篇: 给“AI造”加标识,应对AI作假的有效之举

标签:
  • 热门焦点
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 7月安卓手机好评榜:三星S23Ultra好评率第一

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年7月1日至7月31日,仅限国内市场。第一名:三星Galaxy S23 Ultra好评率:95.71%在即将迎来新
  • 0糖0卡0脂 旭日森林仙草乌龙茶优惠:15瓶到手29元

    旭日森林无糖仙草乌龙茶510ml*15瓶平时要卖为79.9元,今日下单领取50元优惠券,到手价为29.9元。产品规格:0糖0卡0脂,添加草本仙草汁,清凉爽口,富含茶多酚,保留
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 自研Exynos回归!三星Galaxy S24系列将提供Exynos和骁龙双版本

    年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,虽同样采用台积电4nm工艺制
  • iQOO Neo8 Pro抢先上架:首发天玑9200+ 安卓性能之王

    经过了一段时间的密集爆料,昨日iQOO官方如期对外宣布:将于5月23日推出全新的iQOO Neo8系列新品,官方称这是一款拥有旗舰级性能调校的作品。随着发布时
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
Top