当前位置:首页 > 科技  > 软件

华为盘古大模型风波:内部员工揭露研发过程中的套壳与续训问题

来源: 责编: 时间:2025-07-07 09:51:51 266观看
导读近日,科技圈内爆发了一场关于大型语言模型知识产权的争议。争议的核心是华为诺亚方舟实验室开发的盘古大模型(Pangu Pro MoE)被指控存在抄袭行为,指控方为GitHub上的@HonestAGI,其发布的研究论文指出盘古大模型涉嫌抄袭阿

近日,科技圈内爆发了一场关于大型语言模型知识产权的争议。争议的核心是华为诺亚方舟实验室开发的盘古大模型(Pangu Pro MoE)被指控存在抄袭行为,指控方为GitHub上的@HonestAGI,其发布的研究论文指出盘古大模型涉嫌抄袭阿里巴巴的通义千问Qwen-2.5 14B模型。Ejx28资讯网——每日最新资讯28at.com

面对这一指控,华为诺亚方舟实验室迅速作出回应,坚决否认抄袭,并解释称盘古Pro MoE开源模型的部分基础组件代码实现确实参考了其他开源大模型的代码,但这一切都是严格遵循开源许可证要求进行的。Ejx28资讯网——每日最新资讯28at.com

Ejx28资讯网——每日最新资讯28at.com

然而,事态并未因此平息。网络上随后出现了一封疑似华为诺亚方舟实验室内部员工的公开信,信中详细披露了盘古大模型开发过程中的诸多不为人知的细节,并自曝了团队内部存在的一系列问题。Ejx28资讯网——每日最新资讯28at.com

据这位内部员工透露,盘古大模型在开发过程中经历了诸多波折,包括算力有限、模型效果不理想、内部质疑声不断等。在面临巨大压力的情况下,团队做出了一些“非常规”操作,如套壳、续训、洗水印等,以求在短时间内提升模型效果。Ejx28资讯网——每日最新资讯28at.com

这位员工表示,自己曾是盘古大模型团队的一员,对华为有着深厚的感情。然而,这些“非常规”操作让他深感失望和羞愧,认为这些行为将成为自己职业生涯中无法抹去的污点。因此,他决定站出来揭露真相,并申请从盘古部分技术报告的作者名单中移除。Ejx28资讯网——每日最新资讯28at.com

信中,他还详细描述了华为诺亚方舟实验室的内部组织架构和工作流程,以及盘古大模型从最初的设计到后续的开发过程。他提到,盘古大模型早期内部代号叫做“盘古智子”,团队在昇腾卡上进行了大量的训练工作,付出了巨大的心血和代价。Ejx28资讯网——每日最新资讯28at.com

然而,由于种种原因,盘古大模型在开发过程中遇到了诸多困难。例如,71B和135B模型在更换tokenizer时遇到了失败,导致模型效果不理想。在面临内部质疑和领导压力的情况下,团队做出了套壳和续训的决定。Ejx28资讯网——每日最新资讯28at.com

这位员工还透露,王云鹤及其小模型实验室在盘古大模型的开发过程中扮演了重要角色,但他们的做法往往缺乏透明度,甚至存在直接套壳其他模型的情况。这些行为不仅损害了团队的利益,也让认真做事的同事们感到心寒和失望。Ejx28资讯网——每日最新资讯28at.com

信中最后,这位员工以生命、人格和荣誉发誓,所写内容均为真实。他表示,自己不怕被公司追责或威胁,只希望能为真相发声,为那些默默付出的同事们讨回公道。Ejx28资讯网——每日最新资讯28at.com

这封公开信的出现,无疑为这场争议增添了更多的火药味。目前,华为方面尚未对此公开信作出正式回应。但这场争议已经引起了业界的广泛关注,也让人们对大型语言模型的知识产权问题产生了更多的思考。Ejx28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-166968-0.html华为盘古大模型风波:内部员工揭露研发过程中的套壳与续训问题

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 北京治理公共场所人脸识别滥用:若市民遇到“只能人脸识别”,欢迎举报

下一篇: 小米汽车YU7火爆,黄牛手握百单加价,用户面临等一年或多付费抉择

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 零售大模型“干中学”,攀爬数字化珠峰

    文/侯煜编辑/cc来源/华尔街科技眼对于绝大多数登山爱好者而言,攀爬珠穆朗玛峰可谓终极目标。攀登珠峰的商业路线有两条,一是尼泊尔境内的南坡路线,一是中国境内的北坡路线。相
  • 机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

    7月20日消息,据外媒报道,研究机构的报告显示,由于需求下滑,今年二季度全球智能手机的出货量,同比下滑了11%,三星、苹果等主要厂商的销量,较去年同期均有下
  • 世界人工智能大会国际日开幕式活动在世博展览馆开启

    30日上午,世界人工智能大会国际日开幕式活动在世博展览馆开启,聚集国际城市代表、重量级院士专家、国际创新企业代表,共同打造人工智能交流平台。上海市副市
  • 电博会与软博会实现"线下+云端"的双线融合

    在本次“电博会”与“软博会”双展会利好条件的加持下,既可以发挥展会拉动人流、信息流、资金流实现快速交互流动的作用,继而推动区域经济良性发展;又可以聚
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
Top