当前位置:首页 > 科技  > 网络

56年无人解开的数学难题 被谷歌的新AI突破了

来源: 责编: 时间:2025-05-16 09:04:15 130观看
导读 去年,AI 能解出博士级别的数学题,已是轰动一时的大新闻;而今年,能攻克「未解之谜」级别的数学难题的 AI 已经来了。5 月 15 日,Google DeepMind 发布了全新编程智能体 AlphaEvolve。不同于传统的编程 Agent,它专

去年,AI 能解出博士级别的数学题,已是轰动一时的大新闻;FpE28资讯网——每日最新资讯28at.com

而今年,能攻克「未解之谜」级别的数学难题的 AI 已经来了。FpE28资讯网——每日最新资讯28at.com

5 月 15 日,Google DeepMind 发布了全新编程智能体 AlphaEvolve。不同于传统的编程 Agent,它专注于通用算法的自动发现与持续优化。FpE28资讯网——每日最新资讯28at.com

顾名思义,AlphaEvolve 擅长在「进化」中寻找更优解,它模拟自然选择机制,能在代码中不断迭代、演化出创新算法。FpE28资讯网——每日最新资讯28at.com

只要问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法。Google 表示,在组合数学、几何学、数论等超过 50 个未解问题中应用后,AlphaEvolve 在约 20% 的问题上超越了人类现有解法。FpE28资讯网——每日最新资讯28at.com

DeepMind 研究员 Matej Balog 表示:「AlphaEvolve 在十多个公开的数学问题上取得了突破。FpE28资讯网——每日最新资讯28at.com

但让我激动的是:它找到了 56 年以来,4x4 复数矩阵乘法算法的首次改进。这个结果,来自它自创的一种复杂搜索算法。」FpE28资讯网——每日最新资讯28at.com

AlphaEvolve 的价值不仅在数学,它展现出的是一种通用的「算法发现能力」。Balog 表示:「我们对 AlphaEvolve 的应用,还只是触及表层。」FpE28资讯网——每日最新资讯28at.com

01 问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法FpE28资讯网——每日最新资讯28at.com

Google DeepMind 表示,AlphaEvolve 能够在多个复杂问题中取得突破,关键在于其背后运作的是一整套自动进化机制,能持续优化算法并提升性能。FpE28资讯网——每日最新资讯28at.com

从本质上看,AlphaEvolve 解决的是一个通用的黑盒优化问题:maximize h(f)。其中,f 是由大型语言模型生成的程序,h 是衡量该程序质量的评估函数。FpE28资讯网——每日最新资讯28at.com

在实际流程中,AlphaEvolve 首先通过提示采样器(prompt sampler)组装提示词,引导语言模型生成代码。FpE28资讯网——每日最新资讯28at.com

DeepMind 使用了两个不同的 Gemini 模型协同工作:Gemini Flash 以更高速度生成大量候选方案,扩展思路的广度;Gemini Pro 则提供更深入的结构性建议。FpE28资讯网——每日最新资讯28at.com

二者结合,使模型能产出具备实际可行性和算法深度的程序。生成的程序会被送入自动评估系统,经过验证、运行和打分后,写入程序数据库。FpE28资讯网——每日最新资讯28at.com

数据库中运行着一套进化算法,会从已有程序中挑选表现好的方案,为下一轮提示提供方向,不断迭代出更优解。FpE28资讯网——每日最新资讯28at.com

AlphaEvovle 的一个核心点就是这套自动评估指标。它能对生成程序进行验证、运行和评分。FpE28资讯网——每日最新资讯28at.com

每一个程序都会被 h 函数衡量其准确性、运行效率、代码质量等维度。这些评分标准是客观、量化的,使 AlphaEvolve 能够在无需人类直接干预的前提下持续优化。FpE28资讯网——每日最新资讯28at.com

56年无人解开的数学难题 被谷歌的新AI突破了FpE28资讯网——每日最新资讯28at.com

图片来源:GoogleFpE28资讯网——每日最新资讯28at.com

不过,这里的 h 函数依然由人类研究人员定义,可以是准确率、运行时间,甚至代码可读性等维度的组合。FpE28资讯网——每日最新资讯28at.com

AlphaEvolve 负责的只是在给定 h 的前提下去寻找优的 f。对于一些数学问题或研究任务,Google 也可能预设 h。这也说明了 AlphaEvolve 当前的边界:它适用于那些「成果是否优秀」可以自动量化判断的问题。FpE28资讯网——每日最新资讯28at.com

但如何定义「优秀」,仍需人来给出。在需要人类实验才能确定是否优秀的问题上,AlphaEvolve 就无法评估了。FpE28资讯网——每日最新资讯28at.com

以 DeepMind 研究员提到的 4 x 4 复数矩阵乘法为例,研究人员设置了一组任务目标,包括达到的低乘法次数(即张量分解的秩)以及达到该结果的随机种子比例。FpE28资讯网——每日最新资讯28at.com

这些信号构成了 AlphaEvolve 的优化目标,引导它在复杂的搜索空间中稳步「爬山」。AlphaEvolve 从问题定义出发,基于标准的梯度优化流程(包括初始化器、重建损失函数、Adam 优化器等),演化出了一系列高质量的张量分解算法。FpE28资讯网——每日最新资讯28at.com

终,它在 14 个矩阵乘法结构上超越了已知优结果。其中引人注目的,是它提出了历史上第一个能用 48 次乘法完成 4×4 复数矩阵乘法的算法——打破了 56 年未被突破的记录。FpE28资讯网——每日最新资讯28at.com

56年无人解开的数学难题 被谷歌的新AI突破了FpE28资讯网——每日最新资讯28at.com

图片来源:GoogleFpE28资讯网——每日最新资讯28at.com

AlphaEvolve 的技术路线可追溯到 DeepMind 早期提出的 FunSearch 系统。FpE28资讯网——每日最新资讯28at.com

FunSearch 同样利用语言模型引导程序进化,曾被用于发现数学结构或在线算法策略。但与之相比,AlphaEvolve 的扩展性显著提升:它可以修改完整程序,处理多个函数、组件、甚至跨语言结构协同优化,而不仅限于 Python 中的单一函数。FpE28资讯网——每日最新资讯28at.com

这种更高的通用性,使 AlphaEvolve 不再只是一个「智能改函数」的工具,而像是一个可以自主演化大型算法系统的「程序设计伙伴」。FpE28资讯网——每日最新资讯28at.com

据 DeepMind 披露,AlphaEvolve 已被应用于 50 多个数学难题,涵盖数学分析、几何学、组合数学与数论等领域。大多数实验都能在数小时内完成部署。在约 75% 的问题中,它成功重新发现了当前的优解。FpE28资讯网——每日最新资讯28at.com

更令人惊喜的是,在约 20% 的问题中,它给出了比已知方法更好的解法。比如在数学界研究了 300 多年的「接吻数问题」中,AlphaEvolve 构造出由 593 个球体组成的新结构,在 11 维空间中刷新了下界。FpE28资讯网——每日最新资讯28at.com

除了数学,AlphaEvolve 也已在 Google 内部实际落地应用,解决了计算栈中多个层面的工程问题,包括:为 Borg 系统设计新的调度启发式;优化大语言模型训练时使用的矩阵乘法内核;改写 TPU 芯片中的算术电路;加速 Transformer 注意力机制的执行速度。FpE28资讯网——每日最新资讯28at.com

这些任务之间跨度极大,但都具备一个共性:问题能用程序表达、结果能用函数评估。只要这两点成立,AlphaEvolve 就可以发挥作用。FpE28资讯网——每日最新资讯28at.com

02 更多的智能供给,带来无限的游戏FpE28资讯网——每日最新资讯28at.com

此次发布来自 Google DeepMind,这一团队曾推出 AlphaGo、AlphaFold 等具有里程碑意义的 AI 系统,在博弈智能与科学发现领域显著扩展了人工智能的能力边界。FpE28资讯网——每日最新资讯28at.com

AlphaEvolve,与依赖强化学习和自我博弈(如 AlphaGo)的系统不同,是通过语言模型生成大量程序候选,结合自动评估与进化机制,筛选出更优的算法方案。FpE28资讯网——每日最新资讯28at.com

它更像是一种可编排、可扩展的算法构造与发现框架。相比 AlphaGo 展示的是人工智能如何在规则明确定义的博弈中超越人类,AlphaEvolve 的意义可能更在于:它为研究者提供了一种持续、可扩展的算法生成与优化能力。FpE28资讯网——每日最新资讯28at.com

算法设计与调优历来是一种高度稀缺的技术能力。算法工程师在就业市场上普遍享有更高的薪酬与职位门槛,足以反映其复杂性与稀缺性。FpE28资讯网——每日最新资讯28at.com

而现在,只要设定明确的评估方式,AlphaEvolve 就有可能以接近无限的算力和耐心,自动探索并优化算法解法。这意味着,「发现并改进算法」这项曾依赖个体经验的能力,开始从稀缺、手工、不可复制,变为可自动化、可规模化的智能供给。FpE28资讯网——每日最新资讯28at.com

尤瓦尔·赫拉利曾经有一个比喻,形容 AlphaGo 为人类带来的冲击。人类一直在围棋星球上探索如何下围棋,不断有人画出路线图,探索围棋星球的样貌。FpE28资讯网——每日最新资讯28at.com

直到 AI 出现,人类才惊觉,自己不过是在围棋星球的一座小岛上原地打转,而真正的星球辽阔无边,未曾涉足的区域远超想象。FpE28资讯网——每日最新资讯28at.com

而去年到今年,在科研领域,我们也不断地看到 AI 正在做同样的事情。2024 年,AI 相关成果首次同时获得诺贝尔物理学奖与化学奖,而这很有可能成为未来的科研常态。FpE28资讯网——每日最新资讯28at.com

从某种程度上说,AlphaEvolve 所做的,是以前所未有的速度加快这张科研的「未知地图」的展开。FpE28资讯网——每日最新资讯28at.com

以无限的智能供给,让每个领域都有可能被再探索一遍。当「能被发现的算法」不再稀缺,人类对知识的征途,或许才刚刚开始。FpE28资讯网——每日最新资讯28at.com

56年无人解开的数学难题 被谷歌的新AI突破了FpE28资讯网——每日最新资讯28at.com


文章出处:极客公园

本文链接:http://www.28at.com/showinfo-17-150086-0.html56年无人解开的数学难题 被谷歌的新AI突破了

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 被投诉钓鱼网站TOP10出炉:第一名比腾讯、苹果加起来都多

下一篇: 95后天才创始人突然被董事会赶走!美国激光雷达头雁乱了

标签:
  • 热门焦点
  • Redmi Pad评测:红米充满野心的一次尝试

    从Note系列到K系列,从蓝牙耳机到笔记本电脑,红米不知不觉之间也已经形成了自己颇有竞争力的产品体系,在中端和次旗舰市场上甚至要比小米新机的表现来得更好,正所谓“大丈夫生居
  • 小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    在今天下午的小米Civi 2新品发布会上,小米还带来了一款新的降噪蓝牙耳机Necklace,我们也在发布结束的第一时间给大家带来这款耳机的简单分享。现在大家能见到最多的蓝牙耳机
  • 6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月份有一个618,虽然这是京东周年庆的日子,但别的电商也都不约而同的跟进了,反正促销没坏处,厂商和用户都能满意。618期间一些产品也出现了历史低价,那么各个价位段的产品性价比
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • 一文看懂为苹果Vision Pro开发应用程序

    译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实(MR)头戴设备。Vision Pro结合了虚拟现实(VR)和增强现实(AR)的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
  • 当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 超闭合精工铰链 彻底消灭缝隙 三星Galaxy Z Flip5与Galaxy Z Fold5发布

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。三星新一代折叠屏手机采用超闭合精工铰链,让折叠后的缝隙不再可见。同时,配合处
  • 联想的ThinkBook Plus下一版曝光,键盘旁边塞个平板

    ThinkBook Plus 是联想的一个特殊笔记本类别,它在封面放入了一块墨水屏,也给人留下了较为深刻的印象。据有人爆料,联想的下一款 ThinkBook Plus 可能更特殊,它
Top