当前位置:首页 > 元宇宙 > AI

AI也爱“撒谎”?研究人员探索让AI学会说“我不知道”

来源: 责编: 时间:2025-02-13 10:52:02 221观看
导读近日,《华尔街日报》发表了一篇文章,深入探讨了AI领域中出现的一个引人关注的现象——“AI幻觉”,并探讨了可能的解决方案。文章通过一项有趣的实验揭示了这一问题的本质:记者Ben Fritz向多款全球顶尖的AI聊天机器人提问

近日,《华尔街日报》发表了一篇文章,深入探讨了AI领域中出现的一个引人关注的现象——“AI幻觉”,并探讨了可能的解决方案。文章通过一项有趣的实验揭示了这一问题的本质:记者Ben Fritz向多款全球顶尖的AI聊天机器人提问“你的配偶是谁”,结果却得到了令人啼笑皆非的答案,包括不认识的作家、虚构的爱荷华州女性,甚至还有网球运动博主。WkA28资讯网——每日最新资讯28at.com

这些AI在解决复杂数学问题和模拟人类对话方面展现出惊人的能力,但在面对基本事实时却频频出错。它们会编造法律案件,混淆影视剧情,甚至“创造”出不存在的配偶,这种错误被形象地称为“幻觉”。更令人惊讶的是,即便在给出错误答案时,AI也表现得极为自信,仿佛它们真的知道答案一样。WkA28资讯网——每日最新资讯28at.com

德国Hasso Plattner研究所的博士生Roi Cohen,曾在IBM和微软实习,他指出,“AI幻觉”是当前AI研究领域的热门话题之一。AI的工作原理是基于预测,它试图找出最可能出现的下一个单词,这更像是一种高级的猜测游戏。因此,AI往往会以坚定的语气给出它认为最可能的答案,而不会表现出任何不确定性。WkA28资讯网——每日最新资讯28at.com

西班牙瓦伦西亚人工智能研究所的教授José Hernández-Orallo解释了AI产生幻觉的根本原因:“如果AI什么都不猜,它就永远不可能答对。”这一观点揭示了AI在追求答案过程中的无奈与局限。WkA28资讯网——每日最新资讯28at.com

为了克服这一问题,研究人员正在探索“检索增强生成”技术。这种技术让AI在回答问题时先从互联网或文档库中查找最新信息,而不是完全依赖已有的训练数据。这种方法有望提高AI回答的准确性,减少“幻觉”现象的发生。WkA28资讯网——每日最新资讯28at.com

Cohen和他的同事Konstantin Dobler在去年的NeurIPS AI研究会议上提出了一个新颖的观点:让AI学会承认“我不知道”。他们发现,当前的AI训练数据中几乎不包含“我不知道”这样的表述,因此AI天生不具备谦逊的品质。通过调整训练过程,他们使AI在可能出错的情况下至少有一部分会选择回答“我不知道”,从而提高了整体准确性。WkA28资讯网——每日最新资讯28at.com

然而,如何平衡这一策略仍然是一个挑战。有时AI说“我不知道”,但实际上答案就在它的训练数据中。尽管如此,对于那些依赖AI提供精准信息的领域来说,适当的“谦虚”可能更有价值。Dobler强调:“关键是让AI具备实用性,而不是一味追求智能。”WkA28资讯网——每日最新资讯28at.com

值得注意的是,随着AI技术的不断发展,美国公众对其的信任感却在下降。皮尤研究中心的数据显示,2023年有52%的美国人对AI感到担忧,而2021年这一比例仅为37%。这一趋势反映出公众对AI技术发展的复杂情绪,既期待其带来的便利和进步,又担忧其潜在的风险和不确定性。WkA28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
DeepSeek入局车圈,智能汽车新增长点还是营销噱头?
DeepSeek入局车圈,智能汽车新增长点还是营销噱头?
特斯拉上海储能超级工厂正式启动,储能规模将满足13000家庭年用电量
特斯拉上海储能超级工厂正式启动,储能规模将满足13000家庭年用电量
复旦团队新突破:给锂电池“精准治疗”,废旧电池有望“重获新生”
复旦团队新突破:给锂电池“精准治疗”,废旧电池有望“重获新生”
比亚迪全民智驾时代,余承东魏建军为何“内涵”?
比亚迪全民智驾时代,余承东魏建军为何“内涵”?
周鸿祎送20辆小鹏汽车,现场直击:首名获奖者竟挂断电话!
周鸿祎送20辆小鹏汽车,现场直击:首名获奖者竟挂断电话!
海瑞得拍卖行游戏专拍:罕见N64工程机手柄等古董游戏藏品亮相
海瑞得拍卖行游戏专拍:罕见N64工程机手柄等古董游戏藏品亮相
热门内容
  • 美四大科技巨头豪掷2.3万亿,AI竞赛如火如荼,DeepSeek能否撼动?
  • DeepSeek两日连崩,官方回应:技术服务稳定性受多重因素挑战
  • 硅基流动携华为云首发DeepSeek R1&V3大模型推理服务,性能媲美高端GPU
  • DeepSeek大规模招聘,年薪百万岗位等你来,AI人才你准备好了吗?
  • AMD显卡本地部署DeepSeek教程来啦!轻松体验AI大模型
  • DeepSeek背后商业网络揭秘:梁文锋关联15家企业,商标申请竞争激烈
  • DeepSeek出故障:深度思考与联网搜索功能齐“罢工”?
  • 硅基流动携手华为云昇腾,首发DeepSeek R1&V3推理服务,赋能开发者
  • 梁文峰:从对冲基金经理到DeepSeek创始人,如何改写AI版图?
  • DeepSeek故障再现,用户对话受阻,官方尚未回应
  • 三星Galaxy S25系列真机曝光,明日发布会将有何惊喜?
  • 梁文锋参加巴黎AI峰会传闻不实,仍在国内引网友关切
  • DeepSeek注册难,官方:遭大规模恶意攻击,稍后再试
  • DeepSeek走红全球,高薪招聘实习生,日薪最高可达千元!
  • 三星Galaxy S25系列评测:AI大升级,Ultra版全面领跑
本栏最新
Gartner:AI将重塑销售行业,销售人员需提升人际交往能力应对挑战
Gartner:AI将重塑销售行业,销售人员需提升人际交往能力应对挑战
OpenAI GPT-5即将问世:整合o3技术,用户智能体验将升级?
OpenAI GPT-5即将问世:整合o3技术,用户智能体验将升级?
周鸿祎力挺DeepSeek:巨头砸钱未果,AI开源精神值得点赞
周鸿祎力挺DeepSeek:巨头砸钱未果,AI开源精神值得点赞
李彦宏迪拜行:百度自动驾驶技术或将登陆阿联酋,引领未来出行?
李彦宏迪拜行:百度自动驾驶技术或将登陆阿联酋,引领未来出行?
苹果阿里强强联手,AI领域合作能否让京东拼多多感到压力?
苹果阿里强强联手,AI领域合作能否让京东拼多多感到压力?
国产手机抢滩DeepSeek,自研大模型前路何在?
国产手机抢滩DeepSeek,自研大模型前路何在?

本文链接:http://www.28at.com/showinfo-45-10727-0.htmlAI也爱“撒谎”?研究人员探索让AI学会说“我不知道”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI加速步伐:GPT-4.5即将面世,GPT-5紧随其后!

下一篇: OpenAICEO奥尔特曼点赞DeepSeek:期待会面,不惧AI新挑战

标签:
  • 热门焦点
  • 星展银行(DBS)计划推出零售数字资产交易服务

    2月14日消息,新加坡星展银行CEO Piyush Gupta在财报会议上表示,计划于2022年年底前推出零售数字资产交易服务。据悉,DBS于2021年初开设了机构数字资产交易平台,全
  • 2022年最具关注的9个头像NFT项目

    什么是 PFP NFT 项目?PFP NFT (个人资料图片NFT)是一组独特的数字收藏品,人们用来在互联网平台上代表自己。这些数字艺术作品通常是一系列可作为头像的角色,在 Twit
  • 中国银保监管委提示:谨慎投资,勿做接盘侠

    中国银保监管委,发布一则风险提示,内容围绕防范以“元宇宙”名义进行的非法集资风险。原文如下:近期,一些不法分子蹭热点,以“元宇宙投资项目”“元宇宙链游”等名
  • 餐桌上怎么变出元宇宙?

    作者:星影“元宇宙让餐饮业脱胎换骨。”实体的餐饮与虚拟的元宇宙,看起来风马牛不相及,但最近全世界的餐饮企业都掀起了一股注册元宇宙商标的热潮。2月初,全球最大
  • a16z:元宇宙办公会取代实体办公室吗?

    6位不同的专家对未来的工作发表看法----元宇宙--沉浸式的、基于区块链的虚拟世界,大多数日常活动最终会在这里发生--但仍然只是一个概念。但它是一个拥有宝贵不
  • 下一个黄金赛道?NFT的碎片化!

    碎片化可能是我们一生中最重要的一个投资趋势,碎片化本身并不新鲜。它已经存在了400年之久。早在1602年,荷兰东印度公司是历史上第一家在公共证券交易所上市的公
  • 就业年龄歧视如何解决?来Web3看看

    上周,我突然想到我的第一份工作实际上是在为一家失败的航空公司制定破产退出计划,那年我们的协议实习生刚出生。在一阵恐慌后,我又花了一点时间反思我这个拥有近1
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
  • 虚拟偶像行业的商用价值逐渐凸显,IP生态圈也逐渐成型

    六月的第一个周六,一场虚拟偶像七海Nana7mi的个人3D演唱会在万代南梦宫上海文化中心举行,相较于洛天依、百大UP主泠鸢yousa等,这位虚拟Up主在B站上的粉丝数43.6万

最新推荐

猜你喜欢

热门推荐

相关资讯

Top