当前位置:首页 > 科技  > 芯片

DeepSeek联合清华大学推出AI模型训练新技术,将开源发布

来源:icspec 责编: 时间:2025-04-09 07:29:59 204观看
导读据南华早报和彭博(Bloomberg)报道,深度求索(DeepSeek)与清华大学研究人员合作,开发出一种新的强化学习技术。该技术能够降低AI模型的训练成本,同时提升其性能。研究人员发布了一篇论文,详细探讨了如何通过延长推理时间来改善
据南华早报和彭博(Bloomberg)报道,深度求索(DeepSeek)与清华大学研究人员合作,开发出一种新的强化学习技术。该技术能够降低AI模型的训练成本,同时提升其性能。
研究人员发布了一篇论文,详细探讨了如何通过延长推理时间来改善大型语言模型(LLM)的回答准确度。在减少运算资源消耗的同时,这一技术能够提供更加贴近人类需求的答案。目前,大多数主流AI模型采用强化学习方法,通过模型与环境的交互以及奖励机制来完成学习。
在此次研究中,DeepSeek和清华大学设计出一种名为DeepSeek-GRM(生成式奖励模型;Generative Reward Modeling)的技术。该技术基于点状生成式奖励模型(pointwise generative reward modeling),能够以统一的方式评估模型的回应。此外,研究人员还提出了一种名为SPCT(Self-Principled Critique Tuning)的训练方法,使DeepSeek-GRM能够针对特定查询和回应自动提出相应原则,并依据这些原则进行评估。
研究结果显示,DeepSeek-GRM在多项基准测试中表现出色,相较于传统奖励模型,其偏差更小。DeepSeek表示,DeepSeek-GRM模型将进行开源发布。
值得一提的是,DeepSeek此前推出的基础模型V3和推理模型R1曾引发科技界的广泛关注。据路透(Reuters)援引知情人士的消息,下一代推理模型R2可能会比原定的5月更早发布,其程序设计能力将大幅提升。

本文链接:http://www.28at.com/showinfo-27-142479-0.htmlDeepSeek联合清华大学推出AI模型训练新技术,将开源发布

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Cassava计划在非洲部署1.2万颗GPU,携手NVIDIA共建AI工厂

下一篇: 汉翔首季接单超85亿,积极开拓民用航空市场

标签:
  • 热门焦点
  • 一加Ace2 Pro官宣:普及16G内存 引领24G

    一加官方今天继续为本月发布的新机一加Ace2 Pro带来预热,公布了内存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引领,还有呢?#一加Ace2Pro#,2023 年 8 月,敬请期待。”同时
  • 0糖0卡0脂 旭日森林仙草乌龙茶优惠:15瓶到手29元

    旭日森林无糖仙草乌龙茶510ml*15瓶平时要卖为79.9元,今日下单领取50元优惠券,到手价为29.9元。产品规格:0糖0卡0脂,添加草本仙草汁,清凉爽口,富含茶多酚,保留
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 一篇文章带你了解 CSS 属性选择器

    属性选择器对带有指定属性的 HTML 元素设置样式。可以为拥有指定属性的 HTML 元素设置样式,而不仅限于 class 和 id 属性。一、了解属性选择器CSS属性选择器提供了一种简单而
  • 年轻人的“职场羞耻感”,无处不在

    作者:冯晓亭 陶 淘 李 欣 张 琳 马舒叶来源:燃次元“人在职场,应该选择什么样的着装?”近日,在网络上,一个与着装相关的帖子引发关注,在该帖子里,一位在高级写字楼亚洲金
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 由于成本持续增加,笔记本产品价格预计将明显上涨

    根据知情人士透露,由于材料、物流等成本持续增加,笔记本产品价格预计将在2021年下半年有明显上涨。进入6月下旬以来,全球半导体芯片缺货情况加剧,显卡、处理器
  • 外交部:美方应停止在网络安全问题上不负责任地指责他国

      中国外交部今天(16日)举行例行记者会。会上,有记者问,美国情报官员称,他们正在阻拦来自中国以及其他国家的黑客获取相关科研成果。 中方对此有何评论?对此
  • 利用职权私自解除被封帐号 Meta开除20多名员工

    11月18日消息,据外媒援引知情人士表示,过去一年时间内,Facebook母公司Meta解雇或处罚了20多名员工以及合同工,指控这些人通过内部系统以不当方式重置用户帐号,其
Top