当前位置:首页 > 元宇宙 > AI

DeepMind AI破解数学奥赛几何题,金牌水平不在话下?

来源: 责编: 时间:2025-02-08 08:26:23 151观看
导读近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。AlphaGeometry2是D

近期,科技界迎来了一项令人瞩目的成就:谷歌DeepMind实验室的人工智能系统AlphaGeometry2,在攻克国际数学奥林匹克竞赛(IMO)中的几何难题上,取得了前所未有的突破,其解题能力甚至超越了历年的金牌平均水平。lCJ28资讯网——每日最新资讯28at.com

AlphaGeometry2是DeepMind在今年早些时候推出的AlphaGeometry系统的升级版。据DeepMind团队最新发布的论文显示,这一AI系统能够解答过去25年间国际数学奥林匹克竞赛中出现的84%的几何题目。国际数学奥林匹克竞赛作为面向全球高中生的顶级数学赛事,其难度与挑战性不言而喻。而DeepMind认为,探索解决复杂几何问题,尤其是欧几里得几何问题的新方法,或许能够为开发更强大的人工智能提供关键线索。lCJ28资讯网——每日最新资讯28at.com

lCJ28资讯网——每日最新资讯28at.com

在数学领域,证明定理或解释定理为何成立,不仅需要严密的逻辑推理能力,还需要从众多可能的解题路径中做出正确选择。如果DeepMind的见解正确,那么这些解题技巧将是未来构建通用人工智能模型不可或缺的要素。lCJ28资讯网——每日最新资讯28at.com

去年夏天,DeepMind曾展示过一个结合AlphaGeometry2与AlphaProof(一个专注于形式化数学推理的AI模型)的系统,该系统成功解答了2024年国际数学奥林匹克竞赛中的4道题目,占总数6题的2/3。这一成果预示着,类似的方法不仅限于几何问题,还有望拓展至数学乃至科学的其他领域,比如辅助复杂的工程计算。lCJ28资讯网——每日最新资讯28at.com

lCJ28资讯网——每日最新资讯28at.com

AlphaGeometry2的核心组件包括谷歌Gemini系列AI模型中的语言模型,以及一个强大的“符号引擎”。Gemini模型与符号引擎协同工作,符号引擎利用数学规则推导出问题的解决方案,并为给定的几何定理提供有效的证明。lCJ28资讯网——每日最新资讯28at.com

然而,将证明转化为AI可理解的格式并非易事,加之可用的几何训练数据稀缺,给研究带来了不小的挑战。为此,DeepMind为AlphaGeometry2的语言模型专门生成了合成数据,这些数据涵盖了超过3亿个不同复杂度的定理和证明,为AI的训练提供了坚实的基础。lCJ28资讯网——每日最新资讯28at.com

为了验证AlphaGeometry2的解题能力,研究团队从过去25年的国际数学奥林匹克竞赛中精选了45道几何题目,这些题目涉及线性方程和需要在平面上操作的几何对象。随后,他们将这些题目“转化”为一个包含50道题目的更大集合(部分题目因技术原因被拆分为两题)。据论文所述,AlphaGeometry2成功解答了其中的42题,得分超过了平均金牌得主的40.9分。lCJ28资讯网——每日最新资讯28at.com

尽管如此,AlphaGeometry2仍存在一定的局限性。例如,它无法处理涉及可变数量点、非线性方程和不等式的问题。尽管AlphaGeometry2并非首个达到几何问题金牌水平的AI系统,但它是首个在如此广泛的问题集上实现这一成就的系统。lCJ28资讯网——每日最新资讯28at.com

在另一组更具挑战性的题目测试中,AlphaGeometry2的表现略显不足。DeepMind团队额外选取了29道由数学专家提名但尚未出现在竞赛中的题目,AlphaGeometry2仅成功解答了其中的20题。lCJ28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
DeepSeek融资传闻引发热议,阿里股价大涨,AI新贵能否再创辉煌?
02-07
点击查看更多 +
全站最新
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
《哪吒之魔童闹海》上映11天,预测票房直冲110亿大关!
小米汽车提速上市,雷军亲自督战!金车标引发热议
小米汽车提速上市,雷军亲自督战!金车标引发热议
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
以旧换新政策升级,2300万辆乘用车迎来车市新机遇!
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《神奇女侠》游戏重启耗资过亿,华纳游戏部门去年巨亏3亿
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
《怪物猎人:荒野》二测火爆开启,Steam在线人数已超25万!
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
腾讯游戏全球领跑!2025年1月收入榜《王者荣耀》等再创佳绩
热门内容
  • DeepSeek两日连崩,官方回应:技术服务稳定性受多重因素挑战
  • 硅基流动携华为云首发DeepSeek R1&V3大模型推理服务,性能媲美高端GPU
  • DeepSeek大规模招聘,年薪百万岗位等你来,AI人才你准备好了吗?
  • DeepSeek出故障:深度思考与联网搜索功能齐“罢工”?
  • DeepSeek背后商业网络揭秘:梁文锋关联15家企业,商标申请竞争激烈
  • 硅基流动携手华为云昇腾,首发DeepSeek R1&V3推理服务,赋能开发者
  • 梁文峰:从对冲基金经理到DeepSeek创始人,如何改写AI版图?
  • DeepSeek故障再现,用户对话受阻,官方尚未回应
  • 三星Galaxy S25系列真机曝光,明日发布会将有何惊喜?
  • DeepSeek注册难,官方:遭大规模恶意攻击,稍后再试
  • DeepSeek走红全球,高薪招聘实习生,日薪最高可达千元!
  • DeepSeek凌晨发布Janus-Pro,多模态大模型性能超越OpenAI DALL-E 3
  • 三星Galaxy S25系列评测:AI大升级,Ultra版全面领跑
  • DeepSeek深夜发布Janus-Pro,性能超越OpenAI DALL-E 3引关注
  • 深度求索北京大招聘,核心研发岗高薪,实习生日薪可达千元
本栏最新
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
DeepMind AI破解数学奥赛几何题,金牌水平不在话下?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
努比亚Z60 Ultra新系统内测:流畅性提升,这些故障终得修复!
软银400亿美金大手笔!即将成为OpenAI最大投资方
软银400亿美金大手笔!即将成为OpenAI最大投资方
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
紫光新华三拥抱DeepSeek大模型,灵犀使能平台已纳管上架V3与R1版本
小米相册AI写真功能即将下线,你体验过吗?
小米相册AI写真功能即将下线,你体验过吗?

本文链接:http://www.28at.com/showinfo-45-10533-0.htmlDeepMind AI破解数学奥赛几何题,金牌水平不在话下?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI德国设新办,加速欧盟布局步伐

下一篇: 2024年AI创业热潮,百亿美金涌入,中国AI投资仅占美国7%?

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 关于ChatGPT的10点思考

    作者:晏涛三寿近日ChatGPT又有大动作。5月19日,OpenAI在官网宣布正式发布App应用,并登录苹果应用商店。与网页版的聊天机器人相比,iOS应用程序的发布有望让更多人接触到ChatGPT
  • 元宇宙步入暗夜

    撰文 | 文烨豪元宇宙的故事,似乎讲不通了。 当下,刮起元宇宙热潮的Roblox股价已跌去大半,带头大哥Meta也正因元宇宙亏损深陷泥潭。 再看国内,从字节“派对岛&
  • 【量子位】虚拟数字人深度产业报告 | 元宇宙Meta洞见

    虚拟数字人行业未来的主要驱动力包括:用户代际变化,新一代消费者对内容消费和虚拟世界更为渴求;虚拟数字人相关技术门槛相对降低,成本有所回落;资本热度上升,受Metav
  • 韩国主权基金增加对硅谷初创公司投资 押注元宇宙和人工智能

    韩国投资公司(KIC)CEO Seoungho Jin预计,该公司在旧金山的办事处今年将扩招人手,探索在硅谷投资科技、健康和绿色项目。规模高达2000亿美元的韩国主权财富基金—
  • 借VR产业东风,江西抢滩布局“元宇宙”

    自2016年起就在VR上倾注了大量精力的江西省,迅速搭上了“元宇宙”。VR、AR等技术是通往元宇宙的关键接口,使人们可以在数字空间和物理空间自由穿梭。自2016年起
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • 新闻业在元宇宙的现状和未来

    “美联社有毛病吧,这真的过分了!”,一位媒体编辑在推特中愤怒地表示。这是针对一款视频NFT的批评言论之一,之后取消了此次销售,因为该视频呈现了移民穿越地中海的苦
  • 全球十大元宇宙概念游戏

    A股市场中,不少游戏公司早早搭上了元宇宙概念。举例,中青宝宣称将发布一款元宇宙概念的模拟经营类游戏,尽管游戏尚在研发中,这一消息已经让中青宝的股价在51个交易
Top