当前位置:首页 > 元宇宙 > AI

AI读不懂时钟,也算不出星期几?基础时间认知成挑战

来源: 责编: 时间:2025-05-18 16:00:30 152观看
导读近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。

近期,一项关于人工智能(AI)能力边界的研究引起了广泛关注。据LiveScience报道,尽管AI在编程、图像生成、文本创作乃至部分标准化测试中表现出色,但在执行日常生活中看似简单的“读时钟”和“算日子”等任务时,却频频失误。Fyi28资讯网——每日最新资讯28at.com

这项研究在2025年的“国际学习表征会议”(ICLR)上被详细介绍,相关论文已在arXiv平台上发布,尽管尚未完成同行评审。爱丁堡大学的研究员Rohit Saxena是论文的主要作者,他指出,人类对时间和日历概念的掌握几乎是本能的,而AI在这方面的欠缺应被视为一个需要重视的问题。Fyi28资讯网——每日最新资讯28at.com

为了验证这一点,研究团队设计了一系列专门测试时钟识别和日历计算的图像,并将它们输入到多个具备图文处理能力的大型语言模型中,包括meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4。然而,测试结果显示,这些模型在判断时钟时间和推算日期星期上的准确率均未超过50%。Fyi28资讯网——每日最新资讯28at.com

Saxena进一步解释,AI在处理时钟问题时,不仅需要识别指针的位置,还要理解角度和分辨不同风格的表盘,如罗马数字或艺术化设计,这远比简单的物体识别复杂得多。而日历问题同样困扰着AI,特别是在处理如“每年第153天是星期几”这类问题时,错误率依然很高。Fyi28资讯网——每日最新资讯28at.com

研究数据显示,AI在读时钟上的正确率仅为38.7%,而在判断日历上的准确率更是低至26.3%。Saxena强调,AI的推理过程并不基于固定的算法规则,而是依赖于从训练数据中学习到的模式,这导致它们的推理过程缺乏一致性和准确性。Fyi28资讯网——每日最新资讯28at.com

研究还发现,当AI的训练样本中缺乏某些特定现象,如闰年或复杂的日历规则时,它们的表现会进一步下降。即使模型已经理解了“闰年”这一概念,它们也很难将这个知识正确地应用到具体的视觉判断中。Fyi28资讯网——每日最新资讯28at.com

针对这些问题,研究提出了两个改进方向:一是增加训练数据中的代表性示例,以确保AI能够接触到更多样化的情境;二是重新审视AI如何整合逻辑推理与空间感知能力,特别是在处理不常遇到的任务时。这些发现不仅揭示了AI的当前局限,也为未来的研究和开发提供了重要的指导。Fyi28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
新疆夜空惊现神秘飞行物,目击者:与月争辉,瞬间加速消失
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
吉利私有化极氪背后的财务账本:年省百亿,剑指高质量发展
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
50岁大姐考驾照遇挫,教练态度恶劣还学时造假?驾校回应
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
九号电动:700万台销量突破,一季度净利暴涨,智能两轮车新王者崛起?
电车智驾普及快,为何高价油车却落后?
电车智驾普及快,为何高价油车却落后?
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
浪漫启航!自治区总工会助力单身职工寻觅北疆良缘
热门内容
  • 夸克AI新升级:深度搜索赋能,信息获取更高效智能
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • ChatGPT喊你名字了?用户反应不一,个性化尝试遭遇“恐怖谷”
  • 夸克AI新升级“深度搜索”,解锁高效获取信息新技能
  • 蚂蚁集团慷慨分红,单季净利达136亿,阿里持股33%共享成果
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 通义千问3重磅登场!全球顶尖开源模型,通义App与网页版等你来体验
  • 中国首部规范AI气象服务规章6月施行,气象领域将迎来新变革!
  • 小米5月下旬新品爆发:手机平板眼镜手表,你期待哪一款?
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 苹果新款Apple TV 4K即将发布,四大升级能否重塑智能客厅体验?
  • AI长片《海上女王郑一嫂》登陆新加坡院线,影视创作新时代来临?
  • 小米16曝光:或将新增多功能按键,轻薄机身年底亮相?
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 360纳米AI新推MCP万能箱,打造个性化智能体提升效率
本栏最新
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
小米Civi 5 Pro:轻薄机身里的影像与性能王者?
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
广东移动AI秘书上线:漏接电话不再怕,智能代答新体验!
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
火石国际AIGC战略升级,携手兰大文学院开启校企合作新篇章
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
AI闺蜜医生:科学解答女性健康疑惑,守护全生命周期
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国信息通信网络全球领先,5G应用广泛推动数字经济深度融合
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!
中国移动AI速记来袭,通话内容秒变文字记录,信息获取更便捷!

本文链接:http://www.28at.com/showinfo-45-12974-0.htmlAI读不懂时钟,也算不出星期几?基础时间认知成挑战

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 王树国:人文社科在新技术时代不可或缺,文科不会消亡

下一篇: 广州移动携手生态伙伴,共绘大湾区AI落地新蓝图

标签:
  • 热门焦点
  • 欧盟人工智能法案:四种AI系统风险类型的划分及监管措施

    作者:赵志东 蔡佳雯来源:区块链日报该法案采用风险分级的规制路径,将人工智能系统的风险划分成不可接受的风险、高风险、有限风险和轻微风险四种类型,并针对不同类型施加了不同
  • 大厂元宇宙,又菜又爱玩

    撰文 | 吴先之 编辑 | 王 潘当下所有大厂推出的元宇宙产品,所能带来的沉浸式体验并不多,好在国内外科技巨头在bug方面都处在同一水平线。以Meta为例,由于VR头显设
  • 比特币的价格越高,使用价值越大

    隔夜比特币还是在精准地横盘在42k上方。空头昨日试图发起一波小的攻势,但是晚上就被多头掰了回来。以太坊的链上gas price降到了60 gwei以下,彰显着市场活跃度的
  • 元宇宙时代NFT的价值衡量

    有人认为NFT的高昂价格只是炒作的产物,并不具有其对等的价值,但其实NFT并不是空中楼阁,只是区块链数字分类账中的一种形式。诚然,目前的NFT仍处于灰色地带,相关的法
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • 量子计算在未来能否提高区块链技术的效率

    区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
  • 多位全国政协委员提交元宇宙提案,国金证券称元宇宙仍处初期投资阶段

    财联社|区块链日报2日讯 今日《元宇宙新鲜事》有:全国政协委员刘伟建议出台“元宇宙中国”的顶层设计方案;国金证券称元宇宙仍处初期投资庞大获利不易阶段;阿联酋
  • 冬奥会数字收藏品升温,市场再现“一墩难求”

    根据公开信息显示,国际奥委会官方授权的冰墩墩数字盲盒于北京时间2月12日凌晨在nWayPlay平台发售,总数为500个,每个99美元,每人限购5个。此外,不同的奥运徽章数字藏

最新推荐

猜你喜欢

热门推荐

相关资讯

Top