当前位置:首页 > 科技  > 软件

英伟达发布OpenReasoning-Nemotron套件:轻量级推理模型助力科研探索

来源: 责编: 时间:2025-07-21 08:06:56 244观看
导读英伟达近日宣布了一项重大进展,推出了其全新的推理模型套件——OpenReasoning-Nemotron。这一套件内嵌了四个精心构建的模型,它们均基于Qwen-2.5进行微调,参数规模覆盖1.5B至32B不等,源头直指拥有6710亿参数的庞然大物—

英伟达近日宣布了一项重大进展,推出了其全新的推理模型套件——OpenReasoning-Nemotron。这一套件内嵌了四个精心构建的模型,它们均基于Qwen-2.5进行微调,参数规模覆盖1.5B至32B不等,源头直指拥有6710亿参数的庞然大物——DeepSeek R1 0528大模型。通过“蒸馏”技术,英伟达成功实现了大模型的轻量化,使得这些推理模型能够在标准游戏电脑上流畅运行,极大地降低了部署门槛,绕开了高昂的GPU与云计算成本。cz628资讯网——每日最新资讯28at.com

OpenReasoning-Nemotron的核心竞争力并不在于训练技术的突破性创新,而是源于其背后强大的数据支撑。英伟达利用NeMo Skills精心打造了500万个涵盖数学、科学与编程领域的解答数据集,通过纯监督学习的方式对模型进行微调。经过严格测试,32B模型在数学竞赛AIME24中斩获89.2分,在HMMT 2月赛中亦获得73.8分,即便是参数最少的1.5B模型,也分别取得了55.5分和31.5分的佳绩,充分展现了其卓越的推理与解题能力。cz628资讯网——每日最新资讯28at.com

cz628资讯网——每日最新资讯28at.com

英伟达将OpenReasoning-Nemotron定位为科研探索的强大助力,四个模型的完整检查点将在Hugging Face平台开放下载,为研究人员提供了强化学习等进一步实验的坚实基础,同时也便于他们针对特定任务进行定制优化。该模型还支持“GenSelect模式”,即针对每个问题生成多种解答版本,通过筛选最优解来进一步提升准确率。在这一模式下,32B模型在多项数学与编程基准测试中,表现甚至超越了OpenAI的o3-high水平。cz628资讯网——每日最新资讯28at.com

尤为英伟达在训练这些模型时,全程未引入强化学习,仅采用监督微调的方式,为社区提供了一个干净且技术前沿的起点,为未来的强化学习相关研究开辟了广阔空间。对于拥有高性能游戏GPU的玩家及个人开发者而言,这套模型无疑是一个巨大的福音,使他们能够在本地运行接近业界最先进水平的推理模型,极大地推动了推理技术的发展与普及。cz628资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-171575-0.html英伟达发布OpenReasoning-Nemotron套件:轻量级推理模型助力科研探索

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 大电池新潮流!万毫安手机曝光,小米玄戒O2芯片研发加速

下一篇: 再见,带娃焦虑!鸿蒙电脑 + 早教神器,在家学得 high,在校更省心

标签:
  • 热门焦点
  • 小米平板5 Pro 12.4简评:多专多能 兼顾影音娱乐的大屏利器

    疫情带来了网课,网课盘活了安卓平板,安卓平板市场虽然中途停滞了几年,但好的一点就是停滞的这几年行业又有了新的发展方向,例如超窄边框、高刷新率、多摄镜头组合等,这就让安卓
  • 0糖0卡0脂 旭日森林仙草乌龙茶优惠:15瓶到手29元

    旭日森林无糖仙草乌龙茶510ml*15瓶平时要卖为79.9元,今日下单领取50元优惠券,到手价为29.9元。产品规格:0糖0卡0脂,添加草本仙草汁,清凉爽口,富含茶多酚,保留
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 华为HarmonyOS 4.0将于8月4日发布 或搭载AI大模型技术

    华为宣布HarmonyOS4.0将于8月4日正式发布。此前,华为已经针对开发者公布了HarmonyOS4.0,以便于开发者提前进行适配,也因此被曝光出了一些新系统的特性
  • OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    日前OPPO官方宣布,全新的OPPO K11将于7月25日正式发布,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼IMX890主摄,堪称是2000档位影像表
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
Top