当前位置:首页 > 元宇宙 > AI

陶哲轩油管首秀:33 分钟,AI 速证「人类需要写满一页纸」的证明

来源: 责编: 时间:2025-05-14 12:10:56 165观看
导读 快来围观,陶哲轩当视频博主了。第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助 AI 33 分钟就搞定了?!整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。对于这一操作,网友们惊呆:这具有足够的历史意

快来围观,陶哲轩当视频博主了。HYx28资讯网——每日最新资讯28at.com

第一个产出就很炸裂:人类需要写满一页纸的证明,结果借助 AI 33 分钟就搞定了?!HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

整个过程看起来一气呵成,还是全程“盲证”不用过脑子那种。HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

对于这一操作,网友们惊呆:这具有足够的历史意义。HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

在没有明显引导、宣传之下,他的订阅数一天时间已经有 900+,观看数超两千,目前仍然在高速增长中。HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

大家赶在爆火之前留言:HYx28资讯网——每日最新资讯28at.com

今天我们相聚在这里,就是为了见证伟大数学频道的诞生。HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

具体来看看是如何做到?HYx28资讯网——每日最新资讯28at.com

33 分钟盲证定理

陶哲轩这次选取了泛代数中的一个命题,即证明 Magma 方程 E1689 蕴含 E2。HYx28资讯网——每日最新资讯28at.com

方程具体是什么不重要,我们只需要了解,即使是方程理论项目的合作者 Bruno Le Floch,也足足人工花了一页纸才完成证明。HYx28资讯网——每日最新资讯28at.com

而用上 AI 后,整个证明过程仅用时 33 分钟:HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

具体而言,陶哲轩尝试完全基于 Bruno Le Floch 的草稿,逐行进行形式化。HYx28资讯网——每日最新资讯28at.com

他将草稿拆分为微小逻辑单元,交由 GitHub 生成代码骨架,再以 Lean 的 canonical 策略匹配填补细节,过程中也涉及部分手动补全。HYx28资讯网——每日最新资讯28at.com

最终,整个形式化证明能够在 Lean 中通过验证。HYx28资讯网——每日最新资讯28at.com

不仅时间大大缩短了,更重要的是满足了“人类可读性”。HYx28资讯网——每日最新资讯28at.com

要知道 Bruno Le Floch 最初挑战该问题时,曾在论文中宣称 E1689-E2 的所有已知证明都依赖计算机辅助。HYx28资讯网——每日最新资讯28at.com

直到后来他使用 prover9 ATP(自动定理证明器)给出了一个更具可读性的人类版本,所以才对之前的想法产生动摇:HYx28资讯网——每日最新资讯28at.com

它是否仍然可以被认为是计算机辅助的,我不确定。HYx28资讯网——每日最新资讯28at.com

针对这一疑惑,陶哲轩提议今后可以在论文中明确说明,虽然最初的证明是由计算机生成的,但在项目进行过程中,研究者们成功地将其转化为一个人类可读的证明。HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

并且为了实际验证 AI 能在多大程度上开启自动化形式证明,陶哲轩就此开启了本次 YouTube 首秀。HYx28资讯网——每日最新资讯28at.com

通过几次亲自尝试,陶哲轩得出了如下结论:HYx28资讯网——每日最新资讯28at.com

这种半自动化的方法适用于那些技术性强、概念性弱的论证,即那些主要关注细节准确性而非整体概念理解的证明。HYx28资讯网——每日最新资讯28at.com

并且他再一次强调,AI 辅助证明能够把数学家从一些相对不重要的繁琐事务中解放出来,“让 AI 去做一些它擅长的事”。HYx28资讯网——每日最新资讯28at.com

在他看来,尽管最终的结果“并不优雅”,但它体现了 AI 辅助证明的巨大潜力。HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

最后需要说明一下,陶哲轩并非一次就成功了。HYx28资讯网——每日最新资讯28at.com

据他在视频中透露,前两次的证明过程都出现了一些“bug”——HYx28资讯网——每日最新资讯28at.com

第一次拿到的代码才到第 5 行他就有点看不懂了,所以选择了重开;第二次虽然完成了所有证明(用时 48 分钟),但由于是新人博主不太熟悉录屏设备,导致屏幕分享失败,因此又只能重来。HYx28资讯网——每日最新资讯28at.com

数学证明助手迎来 2.0 版本

此外,还有他开发的数学证明助手迎来 2.0 版本升级。HYx28资讯网——每日最新资讯28at.com

HYx28资讯网——每日最新资讯28at.com

根据介绍,这是一个用 Python 开发的轻量级证明助手,其功能远逊于 Lean、Isabelle 或 Rocq 等完整证明助手,但(希望)它能够轻松用于证明一些简短而繁琐的任务。HYx28资讯网——每日最新资讯28at.com

一个具体的目标是,为渐近分析提供支持。HYx28资讯网——每日最新资讯28at.com

两周前,在大模型的帮助之下,他花了四个小时编程得到了这么一个概念验证工具。HYx28资讯网——每日最新资讯28at.com

结果不到两周,这个工具就迎来了全面改进 ——HYx28资讯网——每日最新资讯28at.com

首先,将其改造成一个基本的证明助手,使其能够处理一些命题逻辑;其次,根据反馈,这个证明助手变得更为灵活(在几个关键方面刻意模仿精简证明助手)。HYx28资讯网——每日最新资讯28at.com

目前这个助手有两种模式:假设模式和策略模式。其中策略模式作为默认模式,有点类似于 Lean、Isabelle 或 Rocq 里面那样式儿的策略模式。HYx28资讯网——每日最新资讯28at.com

目前策略列表主要分为四类:HYx28资讯网——每日最新资讯28at.com

命题策略(主要围绕通过布尔运算操纵命题)HYx28资讯网——每日最新资讯28at.com

线性算术策略(依赖于线性规划及其变体)HYx28资讯网——每日最新资讯28at.com

替代策略 —— 用一个假设或目标替代另一个假设或目标的各种技术HYx28资讯网——每日最新资讯28at.com

简化策略 —— 利用其他可用假设来“简化”假设或目标的方法HYx28资讯网——每日最新资讯28at.com

当然这些还不是全部,这个助手支持扩展,大家可以在里面进行添加。HYx28资讯网——每日最新资讯28at.com

举个例子。HYx28资讯网——每日最新资讯28at.com

如果 x,y,z 是正实数,且 x<2y 和 y<3z+1,证明 x<7z+2。HYx28资讯网——每日最新资讯28at.com

将它形式化就会变成:HYx28资讯网——每日最新资讯28at.com

>>>frommainimport*>>>p=linarith_exercise()Startingproof.Currentproofstate:x:pos_realy:pos_realz:pos_realh1:x<2*yh2:y<3z+1|-x<7*z+2

证明助手接收到指令后,指导助手使用各种“策略”来简化问题,直到问题得到解决。HYx28资讯网——每日最新资讯28at.com

那么这个问题可以通过线性算术 Linarith () 求解。HYx28资讯网——每日最新资讯28at.com

>p.use(Linarith())Goalsolvedbylineararithmetic!Proofcomplete

如果想要有详细解释,也是 OK 的:HYx28资讯网——每日最新资讯28at.com

>>>frommainimport*>>>p=linarith_exercise()Startingproof.Currentproofstate:x:pos_realy:pos_realz:pos_realh1:x<2*yh2:y<3*z+1|-x<7*z+2>>>p.use(Linarith(verbose=true))Checkingfeasibilityofthefollowinginequalities:1*z>01*x+-7*z>=21*y+-3*z<11*y>01*x>01*x+-2*y<0Infeasiblebysummingthefollowing:1*z>0multipliedby1/41*x+-7*z>=2multipliedby1/41*y+-3*z<1multipliedby-1/21*x+-2*y<0multipliedby-1/4Goalsolvedbylineararithmetic!Proofcomplete!

可以看到,首先,它通过反证法进行论证,即采用否定 x≥7z+2 目标 x<7z+2 并将其添加到假设中。HYx28资讯网——每日最新资讯28at.com

然后,它将假设中所有不等式转化为“线性规划”形式,变量在左边,常数在右边。HYx28资讯网——每日最新资讯28at.com

最后,它使用精确线性规划来寻找这些不等式的线性组合,从而导致荒谬的不等式,在这种情况下 0<1。HYx28资讯网——每日最新资讯28at.com

解决完问题之后,还可以使用 proof()进行检查。HYx28资讯网——每日最新资讯28at.com

有时候,遇到证明过程会涉及案例拆分的情况,那么证明助手最终会呈现树状结构。HYx28资讯网——每日最新资讯28at.com

对于这个证明助手,陶哲轩表示:非常满意,并且愿意接受进一步的建议或贡献新的功能。比如引入新的数据类型、公例和策略,或者贡献一些有难度的例子。HYx28资讯网——每日最新资讯28at.com

此外还计划开发用于估算符号函数的函数空间规范的工具。例如创建部署霍尔德不等式和索博列夫嵌入不等式等定理的策略。看起来 sympy 框架足够灵活,可以为这类对象创建更多的对象类。HYx28资讯网——每日最新资讯28at.com

感兴趣的朋友,可以前往去体验下哦。HYx28资讯网——每日最新资讯28at.com

参考链接:HYx28资讯网——每日最新资讯28at.com

[1]https://mathstodon.xyz/@tao/114486537464033675HYx28资讯网——每日最新资讯28at.com

[2]https://www.youtube.com/watch?v=cyyR7j2ChCIHYx28资讯网——每日最新资讯28at.com

[3]https://github.com/teorth/estimate_tools/blob/master/EstimateTools/test/equational.leanHYx28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位(ID:QbitAI),作者:白交一水HYx28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12809-0.html陶哲轩油管首秀:33 分钟,AI 速证「人类需要写满一页纸」的证明

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: ChatGPT 深度研究新增导出为 PDF 功能,可保留报告格式

下一篇: 毕马威:中国职场 AI 应用率高达 93%,半数使用者达到常态化应用水平

标签:
  • 热门焦点
  • 在元宇宙卖酸奶,这波联动燃爆了!

    来源:品牌头版 或许,每个人心中都住着一个小馋孩。可能是童年时百吃不厌,觉得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;还有可能,是某种不知为什么,就是很爱吃的
  • 关于ChatGPT的10点思考

    作者:晏涛三寿近日ChatGPT又有大动作。5月19日,OpenAI在官网宣布正式发布App应用,并登录苹果应用商店。与网页版的聊天机器人相比,iOS应用程序的发布有望让更多人接触到ChatGPT
  • 元宇宙是投资中国的第五次重大机遇

    作者为凯思博投资董事长导语:投资逻辑要来自于人性在社会发展过程中的普遍规律,由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天,中国总共经历了
  • 传腾讯已推出全新XR业务;摩托罗拉正打造5GXR颈戴式计算组件

    今日热点:传腾讯已推出全新XR业务;摩托罗拉与Verizon合作打造5G XR颈戴式计算组件;小米AR购物导航专利获授权;VR一体机Simula One放弃众筹并开放直接预订;VR游戏《
  • 顶流IP“冰墩墩”带着中国元素NFT进入全球视野

    一场被国际奥委会主席评价堪称独具匠心、非凡卓越的2022年北京冬季奥运会,在这个“双奥之城”经历了16个令人难忘的精彩日夜,最终圆满闭幕。让我们印象深刻的不
  • 以太坊伦敦升级后,随之生效的以太坊EIP-1559是什么?

    作者:三黎过去的一年里,除了 BTC 一如既往稳坐王位,DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时,也使得其网络日渐拥堵、交易费用增高,成为
  • NFT自动售货机来啦!

    “纽约市有一台售卖 Solana NFT 的自动售货机,用信用卡就能买”Solana NFT 市场 Neon 可让您使用信用卡亲自购买 NFT,无需使用加密货币。由于基于 Solana 链的 N
  • Web 3如何改变传统HR

    互联网自诞生以来,经历了三次迭代。Web1是第一阶段,包括ISP服务器上的个人网页或免费的虚拟主机服务。然后Web2出现了,它引入了动态的用户生成内容、互操作性、增
  • 美国单曲排行榜Billboard和World of Women合作推出NFT杂志封面

    今天,Billboard宣布与流行的NFT头像集World of Women(WoW)建立新的伙伴关系,向NFT生态系统又迈进了一步。在这次合作中,WoW的创建者Yam Karkai将帮助这个音乐行业巨
Top