当前位置:首页 > 元宇宙 > AI

英伟达新突破:ProRL方法助力打造顶级1.5B参数推理AI模型

来源: 责编: 时间:2025-06-05 19:07:41 176观看
导读近期,科技界传来一则引人注目的消息,英伟达研究团队在人工智能领域取得了重要突破。据科技媒体marktechpost报道,英伟达不仅推出了一种名为ProRL的强化学习方法,还成功开发出了目前全球顶尖的1.5B参数推理模型——Nemotro

近期,科技界传来一则引人注目的消息,英伟达研究团队在人工智能领域取得了重要突破。据科技媒体marktechpost报道,英伟达不仅推出了一种名为ProRL的强化学习方法,还成功开发出了目前全球顶尖的1.5B参数推理模型——Nemotron-Research-Reasoning-Qwen-1.5B。mki28资讯网——每日最新资讯28at.com

推理模型,作为专门设计的人工智能系统,其核心在于通过复杂的长链推理过程,得出最终的答案。这一技术在近年来备受关注,而强化学习在这一过程中的作用更是不可忽视。此前,DeepSeek和Kimi等团队已采用可验证奖励的强化学习方法(RLVR),推动了GRPO、Mirror Descent和RLOO等算法的发展。mki28资讯网——每日最新资讯28at.com

然而,尽管强化学习在理论上被认为能够提升大型语言模型(LLM)的推理能力,但实际应用中却面临诸多挑战。现有研究表明,RLVR在pass@k指标上并未显著优于基础模型,这显示出推理能力的扩展存在局限性。当前的研究大多聚焦于数学等特定领域,导致模型过度训练,限制了其探索新领域的潜力。同时,强化学习的训练步数通常较短,往往仅数百步,这使得模型难以充分发展新的能力。mki28资讯网——每日最新资讯28at.com

为了克服这些难题,英伟达研究团队推出了ProRL方法。他们不仅将强化学习的训练时间延长至超过2000步,还大大扩展了训练数据的范围,涵盖了数学、编程、STEM、逻辑谜题和指令遵循等多个领域,共计13.6万个样本。这一举措旨在提升模型的泛化能力,使其能够在不同领域都表现出色。mki28资讯网——每日最新资讯28at.com

在ProRL方法的基础上,英伟达团队采用了verl框架和改进的GRPO方法,成功开发出了Nemotron-Research-Reasoning-Qwen-1.5B模型。这一模型在多项基准测试中均表现出色,超越了基础模型DeepSeek-R1-1.5B,甚至在某些方面优于更大的DeepSeek-R1-7B模型。mki28资讯网——每日最新资讯28at.com

mki28资讯网——每日最新资讯28at.com

测试结果显示,Nemotron-Research-Reasoning-Qwen-1.5B模型在数学领域实现了平均15.7%的提升,编程任务的pass@1准确率提高了14.4%,在STEM推理和指令遵循方面分别提升了25.9%和22.0%,逻辑谜题的奖励值更是提升了惊人的54.8%。这一系列数据充分展示了该模型在不同领域中的强大推理能力和泛化性能。mki28资讯网——每日最新资讯28at.com

英伟达的这一突破无疑为人工智能领域带来了新的希望和可能。随着技术的不断进步和应用的不断拓展,我们有理由相信,未来将有更多像Nemotron-Research-Reasoning-Qwen-1.5B这样的优秀模型涌现出来,为人类社会带来更多的便利和价值。mki28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
三星高管详解Galaxy S25 Edge:超薄设计下电池续航仍可用一整天
三星高管详解Galaxy S25 Edge:超薄设计下电池续航仍可用一整天
微软博客预告片新称谓“Xbox PC”,或预示Xbox生态系统融合趋势?
微软博客预告片新称谓“Xbox PC”,或预示Xbox生态系统融合趋势?
Skullcandy新款Aviator 900 ANC头戴耳机:复古设计融合THX空间音频技术
Skullcandy新款Aviator 900 ANC头戴耳机:复古设计融合THX空间音频技术
尔英HX770-NAS主板亮相,支持多至12个SATA接口,专为NAS打造
尔英HX770-NAS主板亮相,支持多至12个SATA接口,专为NAS打造
宝马X5/X6/X7车型全面升级,动力多样化布局未来出行
宝马X5/X6/X7车型全面升级,动力多样化布局未来出行
《逆水寒》手游牵手可灵AI,图片秒变动图,游戏记录新玩法来袭!
《逆水寒》手游牵手可灵AI,图片秒变动图,游戏记录新玩法来袭!
热门内容
  • 夸克AI新升级:深度搜索赋能,信息获取更高效智能
  • 荣耀“鲲鹏”照片事件真相大白,造谣者道歉遭刑拘
  • 夸克AI新升级“深度搜索”,解锁高效获取信息新技能
  • 腾讯阿里AI to C战场“双吴”争霸,谁将问鼎AI搜索之巅?
  • 英伟达全球总部或将落户中国台湾,黄仁勋下周宣布这一重大决定?
  • 教育部新规:学生禁直接复制AI作业,强化独立思考与批判性思维
  • 联发科天玑9400e发布:天玑9300+升级版,蓝牙升级至6.0
  • TIOBE 5月编程语言榜:Python强势领跑,占比创历史新高
  • 中国GPU市场竞争激烈,英伟达独占7成,华为昇腾紧追其后!
  • 华为nova 14系列震撼登场!鸿蒙5直板机领衔,nova 14仅售2699元起
  • 华为Mate 40系列(5G)已支持5G-A网络,性能再升级!
  • 苹果高管预警:AI发展迅猛,iPhone未来十年或被淘汰?
  • 教育部新规:中小学分阶段用AI,严禁复制答案强化独立思考
  • 华为nova14 Ultra震撼登场!鸿蒙5系统加持,售价4199元起
  • vivo领跑!2025第18周中国手机份额华为小米紧追其后
本栏最新
2025年7月,天翼云息壤杯高校AI大赛,谁将问鼎AI巅峰?
2025年7月,天翼云息壤杯高校AI大赛,谁将问鼎AI巅峰?
Meta豪掷数十亿助力伊利诺伊核电站,延续至2047年运营
Meta豪掷数十亿助力伊利诺伊核电站,延续至2047年运营
TAE获1.5亿融资,谷歌等巨头助力,核聚变发电技术迎新突破?
TAE获1.5亿融资,谷歌等巨头助力,核聚变发电技术迎新突破?
谷歌CEO皮查伊:AI加大投入,工程师团队将持续扩招至2026年
谷歌CEO皮查伊:AI加大投入,工程师团队将持续扩招至2026年
AI押题高考,是备考神器还是心理安慰?
AI押题高考,是备考神器还是心理安慰?
中国移动基金携手中科类脑,共探类脑智能技术新蓝海
中国移动基金携手中科类脑,共探类脑智能技术新蓝海

本文链接:http://www.28at.com/showinfo-45-13486-0.html英伟达新突破:ProRL方法助力打造顶级1.5B参数推理AI模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 6月5日A股收盘:沪指微涨,成交额破万亿,数字哨兵领涨市场!

下一篇: 2025年7月,天翼云息壤杯高校AI大赛,谁将问鼎AI巅峰?

标签:
  • 热门焦点
  • 关于ChatGPT的10点思考

    作者:晏涛三寿近日ChatGPT又有大动作。5月19日,OpenAI在官网宣布正式发布App应用,并登录苹果应用商店。与网页版的聊天机器人相比,iOS应用程序的发布有望让更多人接触到ChatGPT
  • 元宇宙将会如何塑造未来的工作方式?

    科幻小说家尼尔·斯蒂芬森 (Neal Stephenson) 在1992年就创造了“元宇宙”一词,但事实上,在Facebook将其更名为Meta以反映其将这一科幻愿景变为现实的战略重点之
  • 2022年去中心化交易所会崛起吗?

    “在某个时候,去中心化衍生品的交易量可能会超过去中心化现货交易所。”DEX 越来越多地转向第二层解决方案。“数字化金融市场的概念以及如何沿着以用户为中心
  • NFT自动售货机来啦!

    “纽约市有一台售卖 Solana NFT 的自动售货机,用信用卡就能买”Solana NFT 市场 Neon 可让您使用信用卡亲自购买 NFT,无需使用加密货币。由于基于 Solana 链的 N
  • 解决NFT流动性问题:一文了解Floor DAO

    流动性是证券市场上的一个术语,流动性是指资产在不影响其市场价格的情况下可以转换为现成现金的效率,流动性最强的资产是现金本身。现在让我们试着从流动性的角
  • Web 3如何改变传统HR

    互联网自诞生以来,经历了三次迭代。Web1是第一阶段,包括ISP服务器上的个人网页或免费的虚拟主机服务。然后Web2出现了,它引入了动态的用户生成内容、互操作性、增
  • 新闻业在元宇宙的现状和未来

    “美联社有毛病吧,这真的过分了!”,一位媒体编辑在推特中愤怒地表示。这是针对一款视频NFT的批评言论之一,之后取消了此次销售,因为该视频呈现了移民穿越地中海的苦
  • 元宇宙不完全是想出来的,而是实打实做出来的

    沈阳强调,元宇宙不完全是想出来的,而是靠实打实做出来的;互联网向三维化升级是已经明确的大方向,这意味着大量的资金和技术会持续涌入。跨入2022年,元宇宙并没有“
  • 76亿美金估值、2022年最具创新力公司,Dapper Labs如何做到?

    “元宇宙的开拓者”是我们针对元宇宙的发展而设立的专栏,主要面向那些深挖元宇宙产业或者在元宇宙进行“淘金”的从业者,分享这些企业或者创业者们的故事,以独特

最新推荐

猜你喜欢

热门推荐

相关资讯

Top