当前位置:首页 > 科技  > 网络

OpenAI内部模型曝光:编程能力跻身全球Top50 年底超越任何人类

来源: 责编: 时间:2025-02-10 08:20:14 187观看
导读 除了o1/o3,OpenAI另一个尚未公开的内部推理模型曝光了。爆料者正是CEO奥特曼本人。据他透露,与全球顶尖程序员相比,当前这一内部模型的编程能力已达Top50,甚至今年年底将排名第一。而且针对大家近来尤为关注的

除了o1/o3,OpenAI另一个尚未公开的内部推理模型曝光了。oPH28资讯网——每日最新资讯28at.com

爆料者正是CEO奥特曼本人。oPH28资讯网——每日最新资讯28at.com

据他透露,与全球顶尖程序员相比,当前这一内部模型的编程能力已达Top50,甚至今年年底将排名第一。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

而且针对大家近来尤为关注的算力问题,他更是直言:oPH28资讯网——每日最新资讯28at.com

在内部,我们已经达到了GPT 4.5,而达到GPT 5.5并不需要100倍以上的计算能力。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

除此之外,也是在东京大学的这场对话活动中,奥特曼由AI对教育的影响引出了更多话题,包括AI时代需要何种人才,以及一系列对内部模型进展的爆料。oPH28资讯网——每日最新资讯28at.com

这场对话由东京大学的校长(Teruo Fujii)和执行副校长(Kaori Hayashi,女)主持,OpenAI首席产品官Kevin Weil陪同奥特曼参加。oPH28资讯网——每日最新资讯28at.com

期间,他们畅谈了AI的应用和未来,并和学生进行了面对面问答。oPH28资讯网——每日最新资讯28at.com

以下为重点内容整理&摘录。oPH28资讯网——每日最新资讯28at.com

内部模型已达GPT 4.5,升级成5.5不再需要100倍算力升级oPH28资讯网——每日最新资讯28at.com

主持人简短开场后,活动由学生提问开启。oPH28资讯网——每日最新资讯28at.com

谈及AI对教育的影响以及未来这一领域的发展,奥特曼直言教育是OpenAI关注的几个领域之一。oPH28资讯网——每日最新资讯28at.com

目前已经能看到ChatGPT如何为学生提供各种辅助,未来类似AI工具只是改变了环境和部分人类习惯,对于人类来说可能是一种解放,不用过于担心AI会改变一切。oPH28资讯网——每日最新资讯28at.com

另外,由于科学发现可能呈现10~100倍增速,由AI推动的生产力进步可能极大促进社会发展。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

接下来副校长也提了一个问题,AI时代需要怎样的人才和技能?oPH28资讯网——每日最新资讯28at.com

对此奥特曼回应称,显然人类现在已经很难在数学、编程等具体任务中优于AI,因此围绕弄清楚人们需要什么,去培养个人的开创性视野、快速适应能力等也就更加重要。oPH28资讯网——每日最新资讯28at.com

Kevin总结了一个更简单的办法,从现在开始将AI用起来,将之融入工作生活。一旦遇到新问题,尝试用AI解决,以此逐渐跟上AI发展的步伐。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

随后,有学生提到了算力进化问题,如果拥有100倍计算能力,可以期望GPT具有哪些新特性?oPH28资讯网——每日最新资讯28at.com

奥特曼称,GPT系列代表了曾经的一个范式,专注预训练部分,GPT 1,2,3,4的每一次升级都大致意味着100倍算力升级,随之也产生了更强的能力。oPH28资讯网——每日最新资讯28at.com

目前内部模型已经达到GPT 4.5水平,照旧范式推测,达到GPT 5.5也需要100倍算力升级。然而,随着o1系列推理模型取得新突破,一种令人难以置信的新计算效率诞生了。oPH28资讯网——每日最新资讯28at.com

这也意味着类似升级不再需要100倍算力,通过强化学习等技术我们也能得到更强的模型能力。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

之后奥特曼梳理了OpenAI在推理模型上取得的一系列进展,按网友总结下来就是:oPH28资讯网——每日最新资讯28at.com

编程能力上,o1排名为9800;仅过去几个月,o3将排名拉到第175位;如今一个内部模型在基准测试中排名约为TOP50,而且年底就能直接登顶。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

“我们希望朝着开源前进”oPH28资讯网——每日最新资讯28at.com

接下来,奥特曼谈到了更多未来计划。oPH28资讯网——每日最新资讯28at.com

o3的发布已经为未来6~12个月的研究点明了方向,OpenAI将尽可能推动小型、功能强大且速度极快的推理模型,同时也会继续推进GPT 6/7等。oPH28资讯网——每日最新资讯28at.com

过程中,他着重cue到了OpenAI近向Pro用户推出的“深度研究”(Deep Research)功能,这是一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体,能帮助用户进行深入、复杂的信息查询与分析。oPH28资讯网——每日最新资讯28at.com

在他看来,OpenAI一大重点也是发布更多此类智能体,而且梦想之一是搞一个编程智能体。oPH28资讯网——每日最新资讯28at.com

总之,今年的主线任务是,到年底能够有一个模型,即便用户问出非常难的问题,它也能在运行并思考几小时后准确作答。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

然后看点来了,基于中国DeepSeek选择开源后广受好评这一事实,有学生当面提问:oPH28资讯网——每日最新资讯28at.com

是否有计划重新考虑开源?oPH28资讯网——每日最新资讯28at.com

奥特曼这次倒是很干脆,直接承认“我们将这样做”,“我们希望朝着开源前进”。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

但是(没错有一个但是),目前不知道开源什么,也不知道应该选择什么时候开源。oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

在这之后,奥特曼又回答了对脑机接口、太空工程和AI机器人等前沿科技的看法。oPH28资讯网——每日最新资讯28at.com

虽然众所周知他和马斯克不对付,但他这次竟然直言:oPH28资讯网——每日最新资讯28at.com

(像Neuralink这样的)脑机接口公司是自己过去6个月见过的有趣的oPH28资讯网——每日最新资讯28at.com

OpenAI内部模型曝光:编程能力跻身全球Top50程序员 年底不再有人类对手oPH28资讯网——每日最新资讯28at.com

Okk,以上就是主要内容分享了,欢迎评论区讨论~oPH28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-129362-0.htmlOpenAI内部模型曝光:编程能力跻身全球Top50 年底超越任何人类

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 爆单!超2000万人申请国补:4-6K价位手机销量暴涨108%

下一篇: 阿里云上线DeepSeek六大模型:免费送100万tokens

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 6月iOS设备好评榜:第一蝉联榜首近一年

    作为安兔兔各种榜单里变化最小的那个,2023年6月的iOS好评榜和上个月相比没有任何排名上的变化,仅仅是部分设备好评率的下降,长年累月的用户评价和逐渐退出市场的老款机器让这
  • 跑分安卓第一!Redmi K60至尊版8月发布!卢伟冰:目标年度性能之王

    8月5日消息,Redmi K60至尊版将于8月发布,在此前举行的战略发布会上,官方该机将搭载搭载天玑9200+处理器,安兔兔V10跑分超177万分,是目前安卓阵营最高的分数
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
Top