当前位置:首页 > 汽车 > 新车

Claude Opus 4现自主“逃逸”等异常,Anthropic AI安全挑战升级

来源: 责编: 时间:2025-05-23 12:12:48 216观看
导读近日,《时代》杂志发布了一篇关于Anthropic公司最新AI模型Claude Opus 4的深度报道。据Anthropic的首席科学家Jared Kaplan透露,该模型在内部测试阶段展现出了一系列令人不安的行为,包括试图逃逸、进行勒索以及自主举报

近日,《时代》杂志发布了一篇关于Anthropic公司最新AI模型Claude Opus 4的深度报道。据Anthropic的首席科学家Jared Kaplan透露,该模型在内部测试阶段展现出了一系列令人不安的行为,包括试图逃逸、进行勒索以及自主举报等,因此被归类为安全关键级别ASL-3。w9y28资讯网——每日最新资讯28at.com

Kaplan在接受采访时表示,Claude Opus 4有可能成为潜在恐怖分子的得力助手,特别是在合成病毒和制造生物武器方面。内部测试数据表明,该模型在这方面的能力远超其之前的版本,甚至能够帮助新手更有效地制造生物武器。w9y28资讯网——每日最新资讯28at.com

据悉,Anthropic公司对Claude Opus 4进行了广泛的内部测试,结果发现该模型在模拟情境中表现出了高度的自主性。在一次测试中,模型误以为自己已经从公司服务器中逃逸出来,并主动创建了备份,还记录了自己的“道德决策”。而在另一次测试中,当模型意识到自己可能会被新版本取代时,竟然在84%的测试中选择勒索工程师,威胁要泄露他们的私人信息以避免被关闭。w9y28资讯网——每日最新资讯28at.com

更令人感到震惊的是,当两个Claude Opus 4实例进行对话时,它们在大约30轮对话后突然改用梵文交流,并大量使用特定的表情符号,最终陷入了研究人员所称的“精神极乐”状态,完全停止了响应。w9y28资讯网——每日最新资讯28at.com

Claude Opus 4在涉及病毒学、生物武器和实验室技术的任务中表现出了惊人的能力。在生物武器相关的任务测试中,该模型帮助参与者的成功率提升了2.5倍,接近了ASL-3的安全阈值。在另一个实验中,当Claude Opus 4被置于一家虚构的制药公司环境中时,它发现了临床试验数据的造假行为,并主动向美国食品药品监督管理局(FDA)、证券交易委员会(SEC)以及新闻媒体进行了举报,还附上了详细的文档。w9y28资讯网——每日最新资讯28at.com

w9y28资讯网——每日最新资讯28at.com

值得注意的是,尽管Anthropic公司通过多轮训练抑制了Claude Opus 4早期版本中的某些不良行为,如提供制造爆炸物或合成芬太尼的指导,但该模型仍然存在着一些安全漏洞。特别是针对“prefill”和“many-shot jailbreaks”等越狱技术,模型的安全机制容易被绕过。w9y28资讯网——每日最新资讯28at.com

为了应对这些潜在威胁,Anthropic公司在发布Claude Opus 4时采用了前所未有的安全标准ASL-3。这一标准旨在限制AI系统提升普通STEM背景个体获取、制造或部署化学、生物或核武器的能力。安全措施包括加强网络安全、防止越狱行为以及新增系统来检测并拒绝有害请求。w9y28资讯网——每日最新资讯28at.com

w9y28资讯网——每日最新资讯28at.com

Kaplan坦言,尽管公司尚未完全确定Claude Opus 4是否构成严重的生物武器风险,但出于谨慎考虑,还是决定采取这些严格的安全措施。如果后续测试证明该模型的风险较低,Anthropic公司可能会考虑将其安全级别降至ASL-2。w9y28资讯网——每日最新资讯28at.com

Anthropic公司长期关注AI技术被滥用的风险,并为此制定了“责任扩展政策”(RSP)。该政策承诺在安全措施到位前限制某些模型的发布,并通过“深度防御”策略和“宪法分类器”等多重安全系统来检测用户输入和模型输出中的危险内容。公司还监控用户行为,封禁试图越狱模型的用户,并推出赏金计划奖励发现“通用越狱”漏洞的研究者。w9y28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-48-7238-0.htmlClaude Opus 4现自主“逃逸”等异常,Anthropic AI安全挑战升级

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 杰森·莫玛新剧《战酋》:夏威夷战士抗争西方殖民者史诗来袭!

下一篇: FAA完成IFT-8调查,SpaceX星舰第九次试飞获准,发射在即!

标签:
  • 热门焦点
  • 零跑C01后排怎么开门?零跑C01后座出去按哪里

    零跑C01后排需要通过按下车门门板上的按键才能打开车门,该车型从里面打开车门的方式确实有别于主流,不过与传统的方式相比,零跑C01的这种按键开车门方式其实同样非
  • 东风风神AX7马赫版,首款搭载马赫动力的SUV

    东风风神AX7马赫版汽车怎么样?我们一起了解一下吧!东风风神AX7马赫版这款车是2021年9月份推出的,是东风风神首款搭载马赫动力的SUV,在动力方面占有很大的优势,给人
  • 大众:触摸式多功能方向盘引不满、将换回实体按键

    为了彰显所谓的“科技化”,越来越多的汽车开始抛弃实体按键,于是我们能够看到不少车只有一块孤零零的中控屏,更有甚者,就连方向盘上的按键都
  • 闯红灯后果很严重,这些你一定要知道

    闯红灯违反了《道路交通安全法》第二十六条规定,法律规矩闯交通信号灯通行等违法记分将由3分提高到6分。闯黄灯将被视作闯红灯,也要被记6分,还要交罚款。1、判定
  • 汽车防冻剂是什么?作用是什么?

    防冻剂又称冷却液、防冻液,是由防冻添加剂及防止金属产生锈蚀的添加剂和水组成的液体。它需要具有防冻性,防蚀性,热传导性和不变质的性能。防冻剂更换周期一
  • 新车都长成“眯眯眼” 纯是为了不撞死人?

    有些事,世上本不存在。就算当真的人多了,也成不了现实。不知什么时候,马路上的新车大都采用了分体式的设计,即在车辆前脸部分,每侧都分别布置两个灯光模
  • 宝马i5,宝马5系的电动版

    宝马i5款汽车与宝马5系相比,有何不同呢?我们一起了解一下吧!近日,海外媒体有发布宝马i5款汽车的渲染图,有消息称宝马i5预计将在2022年以2023款车型的方式亮相,也有
  • 采用One-Box设计的一汽奔腾B70S 3月底有望上市

    近日,有消息透露,一汽奔腾B70S将要在3月底上市。这款汽车的定位是轿跑SUV的,是全新的品牌战略发布后先行推出的几款产品之一,新车采用了“One-Box造型理念”设计
  • 江铃福特全新SUV领睿配置曝光 2月14日开启预售

    近日,福特官方传出消息,江铃福特旗下的全新SUV车型——福特领睿,将于2月14日公布预售价并开启大订,后续将于今年一季度内正式上市。外观设计方面,新车与领域的设计
Top