当前位置:首页 > 科技  > 软件

2024 阿里巴巴全球数学竞赛开考,563 支 AI 队伍首次参赛,挑战“人类智慧皇冠”

来源: 责编: 时间:2024-04-15 18:07:38 236观看
导读 北京时间 4 月 15 日上午 8 点,2024 阿里巴巴全球数学竞赛预选赛正式交卷,58 个国家与地区的选手在线鏖战 48 小时,更有来自全球知名高校院所与企业的 563 支队伍使用 AI 作答,其中 00 后占比超 50%。他们各显神

北京时间 4 月 15 日上午 8 点,2024 阿里巴巴全球数学竞赛预选赛正式交卷,58 个国家与地区的选手在线鏖战 48 小时,更有来自全球知名高校院所与企业的 563 支队伍使用 AI 作答,其中 00 后占比超 50%。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,推动 AI 构建更强大的数学能力。bWL28资讯网——每日最新资讯28at.com

阿里巴巴全球数学竞赛组委会介绍,当前,AI 已经在不少领域展现超越人类的能力,但在“人类智慧的皇冠”数学领域还颇为受限。因此,从 2024 年起,阿里巴巴全球数学竞赛决定向 AI 开放,鼓励探索 AI 的潜力上限,推动 AI 在数学领域的研究和应用创新。bWL28资讯网——每日最新资讯28at.com

在这场 48 小时的预选赛中,AI 和人类选手共用一套试卷,题目包括选择题、解答题与证明题。为了保证公平,防止“人类替考”,组委会制定了“赛前固定方案、赛中诚实答题、赛后复现总结”的三步走规则。因此,在正式开考之前,AI 参赛团队就需要完成模型的训练或微调,并锁定做题版本;如使用提示词工程,也需要提前提交相应方案。bWL28资讯网——每日最新资讯28at.com

AI 挑战赛吸引了全球 563 支队伍踊跃报名,主要来自全球知名高校院所与企业,包括北大、清华、牛津、中国科学院、AWS、字节跳动等,大多具有 AI 专业背景,也有部分来自数学、物理等专业。统计显示,参赛队伍中,00 后占比超 50%,年轻一代正在成为 AI 生力军,用多种形式热情探索 AI 的数学上限。他们有的在开源大模型的基础上进行专项微调,让 AI 从初等数学进阶到高等数学;他们有的构建起 AI Agent,结合提示词工程来调用 GPT-4 等闭源模型,使得 GPT-4 的数学解题能力有大幅提升。bWL28资讯网——每日最新资讯28at.com

西南交通大学应用物理系的大四学生向劲宇是一名 AI 开发者,也是 MetaGPT-MC 小组贡献者之一,这次他和多位开发者组队参赛,使用 GPT-4 与 Claude 3 组成 Muti-Agent 的方案,让 AI 分饰多个角色、相互验证来完成答题步骤,改善了 AI“一本正经的胡说八道”的通病,提升了 AI 做题的准确性。在 AWS 从事 AI 研究的毛帽,是数学专业的博士,已连续三年参赛,今年转换身份,从人类选手转为 AI 的竞赛辅导员,与同事组成一支“豪华团队”,集合了数学、统计、地球物理及机器学习背景的 4 名博士,希望能向人类选手们秀一把 AI 的实力。bWL28资讯网——每日最新资讯28at.com

据介绍,本次 AI 挑战赛结果将于 6 月与人类选手成绩同期公布,AI 前三名分别获得奖金 10000 美元、5000 美元、2000 美元。不少选手表示,他们更期待的是,AI 的成绩能否达到人类优秀选手水平,能否达到决赛资格线?在往年的阿里巴巴全球数学竞赛中,只有 1% 的预选赛选手能够晋级决赛。bWL28资讯网——每日最新资讯28at.com

由阿里巴巴公益、达摩院共同举办的阿里巴巴全球数学竞赛,以不设报名门槛、趣味十足著称,举办 6 届以来不断推陈出新,比如把蚂蚁森林种树、张师傅扭宽面等题目引入竞赛,激发全民数学热情。今年,这项赛事更是紧扣 AI 与数学融合的技术趋势,首次向 AI 开放,不限选手是碳基还是硅基。bWL28资讯网——每日最新资讯28at.com

bWL28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-83429-0.html2024 阿里巴巴全球数学竞赛开考,563 支 AI 队伍首次参赛,挑战“人类智慧皇冠”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 我国在建核电机组数量装机容量均保持世界第一

下一篇: 苹果 CEO 库克抵达越南,将会见当地内容创作者、开发商和学生

标签:
  • 热门焦点
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 使用Webdriver-manager解决浏览器与驱动不匹配所带来自动化无法执行的问题

    1、前言在我们使用 Selenium 进行 UI 自动化测试时,常常会因为浏览器驱动与浏览器版本不匹配,而导致自动化测试无法执行,需要手动去下载对应的驱动版本,并替换原有的驱动,可能还
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 自律,给不了Keep自由!

    来源 | 互联网品牌官作者 | 李大为编排 | 又耳 审核 | 谷晓辉自律能不能给用户自由暂时不好说,但大概率不能给Keep自由。近日,全球最大的在线健身平台Keep正式登陆港交所,努力
  • 腾讯VS网易,最卷游戏暑期档,谁能笑到最后?

    作者:无锈钵来源:财经无忌7月16日晚,上海1862时尚艺术中心。伴随着幻象的精准命中,硕大的荧幕之上,比分被定格在了14:12,被寄予厚望的EDG战队以绝对的优势战胜了BLG战队,拿下了总决
  • 华为Mate60标准版细节曝光:经典星环相机模组回归

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • 联想的ThinkBook Plus下一版曝光,键盘旁边塞个平板

    ThinkBook Plus 是联想的一个特殊笔记本类别,它在封面放入了一块墨水屏,也给人留下了较为深刻的印象。据有人爆料,联想的下一款 ThinkBook Plus 可能更特殊,它
  • Meta盲目扩张致超万人被裁,重金押注元宇宙而前景未明

    图片来源:图虫创意日前,Meta创始人兼CEO 马克·扎克伯发布公开信,宣布Meta计划裁员超11000人,占其员工总数13%。他公开承认了自己的预判失误:“不仅
Top