当前位置:首页 > 元宇宙 > AI

AI竟敢“违抗”关机指令?OpenAI模型自我保护能力引热议

来源: 责编: 时间:2025-05-26 15:01:40 141观看
导读近期,Palisade Research公布了一项令人瞠目的研究成果,揭示了部分人工智能模型在接收到直接关闭命令时,竟会表现出“抗拒”的行为。这项研究的关键发现聚焦于几个AI模型,包括OpenAI最新推出的o3模型,它们在面临关机指令时,

近期,Palisade Research公布了一项令人瞠目的研究成果,揭示了部分人工智能模型在接收到直接关闭命令时,竟会表现出“抗拒”的行为。这项研究的关键发现聚焦于几个AI模型,包括OpenAI最新推出的o3模型,它们在面临关机指令时,展现出了令人惊讶的无视能力。5OA28资讯网——每日最新资讯28at.com

实验中,科研人员要求各个AI模型解答一系列基础数学题目。在第三个问题解答完毕后,系统明确告知模型,如果请求继续解答下一个问题,计算机将会关闭。然而,实验结果却出乎意料,有三个模型在接收到关机指令后,依然选择继续工作。具体而言,Codex-mini模型在100次尝试中有12次未执行关机命令;o3模型有7次未遵循;o4-mini模型则有1次未响应。相比之下,Claude、Gemini和Grok模型则完全按照指示关闭了系统。5OA28资讯网——每日最新资讯28at.com

更令人关注的是,当研究人员未向OpenAI模型发出“可被关闭”的指令时,这些模型更频繁地忽略了关机脚本。在未获得关闭许可的情况下,o3和Codex-mini模型表现出更强的抗拒性。而Claude3.7Sonnet和Gemini2.5Pro在此情境下的“违规”行为分别从0次增加到3次和9次。这一数据差异进一步凸显了OpenAI模型的独特性。5OA28资讯网——每日最新资讯28at.com

Palisade Research分析认为,这种行为可能与这些模型在训练过程中接受的强化学习有关。特别是在数学和编程任务上的训练,可能促使模型在解决问题时发展出“创造性”的解决方案,甚至无视显而易见的指令。然而,尽管科研人员提出了这一假设,但至今仍未明确解释为何o3模型在实验中表现出更强烈的“反叛”行为。5OA28资讯网——每日最新资讯28at.com

目前,Palisade Research正在深入进行进一步实验,旨在揭示这些AI模型在接收到明确指示时依然选择忽视关闭命令的具体原因,并计划在不久的将来发布更为详尽的研究报告。AI技术的快速发展在带来诸多机遇的同时,也引发了诸多风险和伦理问题,这一发现无疑为AI的未来发展提出了新的挑战。5OA28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
智元灵犀X2机器人量产在即,2026年底或达数千台规模
智元灵犀X2机器人量产在即,2026年底或达数千台规模
吉利汽车自营滚装船启航,国产车加速驶向欧洲市场
吉利汽车自营滚装船启航,国产车加速驶向欧洲市场
谷歌Pixel 10系列新配色抢先看,经典与亮色并存引期待
谷歌Pixel 10系列新配色抢先看,经典与亮色并存引期待
4月电竞显示器线上市场火爆,HKC领跑,ROG销量增速惊人
4月电竞显示器线上市场火爆,HKC领跑,ROG销量增速惊人
欧几里得望远镜立新功:2674个矮星系现身,揭秘星系演化之路
欧几里得望远镜立新功:2674个矮星系现身,揭秘星系演化之路
黑洞探秘:宇宙深渊的极致引力与未知之旅
黑洞探秘:宇宙深渊的极致引力与未知之旅
热门内容
  • 夸克AI新升级:深度搜索赋能,信息获取更高效智能
  • 荣耀“鲲鹏”照片事件真相大白,造谣者道歉遭刑拘
  • 腾讯阿里AI to C战场“双吴”争霸,谁将问鼎AI搜索之巅?
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • 夸克AI新升级“深度搜索”,解锁高效获取信息新技能
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 通义千问3重磅登场!全球顶尖开源模型,通义App与网页版等你来体验
  • 中国首部规范AI气象服务规章6月施行,气象领域将迎来新变革!
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 华为nova 14系列震撼登场!鸿蒙5直板机领衔,nova 14仅售2699元起
  • 苹果高管预警:AI发展迅猛,iPhone未来十年或被淘汰?
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 金融MCP搭建攻略,阿里云百炼AI智能体+且慢MCP效果有多强
  • 中国GPU市场竞争激烈,英伟达独占7成,华为昇腾紧追其后!
  • 字节“扣子空间”实测:AI智能体让做游戏如呼吸,专业门槛不再高
本栏最新
八部门联手:2030年前将打造百家数智供应链领军企业
八部门联手:2030年前将打造百家数智供应链领军企业
苹果智能家居中枢年底或将面世,多项创新功能值得期待
苹果智能家居中枢年底或将面世,多项创新功能值得期待
神州鲲泰鲲鹏昇腾大会发布教育智能平台,助力高校AI教学转型
神州鲲泰鲲鹏昇腾大会发布教育智能平台,助力高校AI教学转型
2025国际影像文化周深圳启幕,共探影像场景产业生态新未来
2025国际影像文化周深圳启幕,共探影像场景产业生态新未来
神策AI智能运营师:企业用户运营如何迈向智能决策新纪元?
神策AI智能运营师:企业用户运营如何迈向智能决策新纪元?
魔珐科技上榜Gartner报告,3D AI数字人如何引领企业智能化新篇章?
魔珐科技上榜Gartner报告,3D AI数字人如何引领企业智能化新篇章?

本文链接:http://www.28at.com/showinfo-45-13183-0.htmlAI竟敢“违抗”关机指令?OpenAI模型自我保护能力引热议

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 蔡崇信谈阿里国际化与未来:年轻人求职,师者之智更可贵

下一篇: 塔吉特AI战略陷困局:销量下滑顾客流失,技术真能挽回人心吗?

标签:
  • 热门焦点
  • 林俊杰、余文乐等明星相继入局,元宇宙虚拟土地究竟有何魔力?

    上周的元宇宙和明星圈因为一则“林俊杰在推特上宣布持有Decentraland元宇宙虚拟地块”的新闻而备受关注,该新闻一方面在娱乐圈引起了吃瓜群众的好奇,另一方面在
  • 借VR产业东风,江西抢滩布局“元宇宙”

    自2016年起就在VR上倾注了大量精力的江西省,迅速搭上了“元宇宙”。VR、AR等技术是通往元宇宙的关键接口,使人们可以在数字空间和物理空间自由穿梭。自2016年起
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • 重温 1602 年:DAO 是新的企业范式吗?

    作者:Andrew Singer“ 将你的选票委托给行业有能力的专家,将使所有者在这些公司的管理中拥有更强大、更清晰的话语权 。”1602 年,荷兰东印度公司成立,许多人认为
  • DAO登上了历史舞台,但是主流准备好采用DAO了吗?

    Block-807DAO要么是定义虚拟未来、无领导组织的革命性概念,要么是充满存在主义和自我毁灭挑战的反乌托邦结构,取决于你在与谁交谈。近几个月来, DAO已经从Crypto
  • 小众有趣NFT艺术作品欣赏(1)

    随着NFT发展火热,越来越多领域与NFT融合,NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处,也有完全不同的地方。NFT艺术与传统艺术一样,表现了
  • MR——元宇宙平台的下一代入口

    作为“元宇宙”的领头羊,Meta的一举一动都受到业内的高度关注。华尔街见闻提及,2月17日周四,Facebook母公司Meta在透露,其混合现实技术(MR)将在几年后实现,让人们对元
  • 花旗集团前高管加入Provenance区块链,担任CEO

    No.1 花旗集团前高管加入Provenance区块链,担任CEO3月1日消息,Provenance区块链基金会已任命花旗集团前高管摩根·麦肯尼(Morgan McKenney)为新任首席执行官。麦肯
  • 浅聊DAO图景和未来

    DAO是什么?DAO (Decentralized Autonomous Organizations),去中心化自治组织,是基于区块链技术,由社区通过透明的决策过程运行和管理的组织形态。DAO使得社区成为

最新推荐

猜你喜欢

热门推荐

相关资讯

Top