当前位置：首页 > 科技 > 网络

Nature封面：AI训AI 越训越傻

来源：责编：时间：2024-07-28 07:49:44 232观看

导读 AI训练AI，可能会让AI变傻？！来自牛津、剑桥等学校机构的研究人员新发现，使用合成数据训练，大模型可能会崩溃。其研究成果被选为新的Nature封面。直接一个：GARBAGE OUT！要知道，现在绝大部分科技公司的大模型都在用合

AI训练AI，可能会让AI变傻？！

来自牛津、剑桥等学校机构的研究人员新发现，使用合成数据训练，大模型可能会崩溃。其研究成果被选为新的Nature封面。

直接一个：GARBAGE OUT！

Nature封面：AI训AI 越训越傻

要知道，现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个行业浇了一波冷水。

研究团队给了这样一个例子。

他们测试了Meta的OPT-125m模型，询问了关于中世纪建筑的相关信息。

Nature封面：AI训AI 越训越傻

每一次微调都是由上一次生成的数据来训练。结果前面几轮回答还好。结果就在第九次，就开始胡说八道……

扯到兔子是什么鬼？！

该论文主要作者表示，他们曾考虑过合成数据可能对大模型造成误差，但未曾预料到模型的恶化速度会如此迅速。

三个误差导致模型崩溃

首先，团队定义了什么是模型崩溃。

模型崩溃是一个退化过程，模型生成的内容会污染下一代的训练数据集。而在被污染的数据上训练之后，新一代模型就容易误解现实。

以此循环往复，一代更比一代差。

Nature封面：AI训AI 越训越傻

按照时间推移，主要分为两种情况：早期模型崩溃和晚期模型崩溃。

早期模型崩溃中，模型开始丢失一些尾部信息。（类似概率分布中一些低概率事件）而在晚期模型崩溃，模型将收敛到同原始分布几乎没有任何相似之处。

这一过程的发生，同模型设计、学习过程和所用数据质量有关。

具体到理论中，主要包括了这三个误差导致大模型同原始模型的偏离。

统计近似误差。这是主要类型的误差，由于样本数量有限而产生，并随着样本数量趋于无穷大而消失。这是因为在重新采样的每一步中信息都有可能丢失，这种概率不为零。函数表达性误差。这种误差是由于函数近似表达能力有限而产生的。特别是，神经网络只有在其规模达到无穷大时才是通用近似值。不过，在没有其他两种误差的情况下，这种误差只会发生在第一代。函数近似误差。主要由学习过程局限性引起，例如随机梯度下降的结构偏差或目标的选择。这种误差可以看作是在无限数据和每一代都具有完美表达能力的情况下产生的误差。

对语言模型的影响

随后研究人员评估了模型崩溃对语言模型的影响。由于从头开始训练大模型成本非常高，他们选择评估语言模型常见的设置：微调设置。

每个训练周期都从具有新数据的预训练模型开始。训练数据来自另一个经过微调的预训练模型。

他们用Meta因果语言模型OPT-125m，在wikitext2上进行了微调。

为了从训练好的模型中生成数据，团队使用了five-way波束搜索。他们将训练序列设为 64 个token长度；然后对于训练集中的每个token序列，要求模型预测下一个64个token。

他们会浏览所有原始训练数据集，并生成一个相同大小的人工数据集。如果模型的误差为0，它就会生成原始的wikitext2数据集。

为了进一步感受区别，他们采用两种不同的设置：一组是除了开始训练，后续过程没有任何原始训练数据；另一组则是保留10%的原始数据。

Nature封面：AI训AI 越训越傻

结果显示，随着时间推移，模型产生的错误会增加。在模型完全崩溃之前，它还会导致模型遗忘数据集中低概率事件，他们的输出也变得更加同质化。终也就出现了开头这一现象。

另外在VAE、GMM模型中看到了类似模型崩溃的现象。

Nature封面：AI训AI 越训越傻

来自杜克大学的Emily Wenger教授表示，到目前为止，要缓解这一问题并非易事。

有领先的科技公司已经部署了一项技术，即嵌入“水印”——

标记AI生成的内容，让其在训练数据中排除。但困难在于，这需要科技公司之间的协调，因此不太具有商业可行性。

这样一来，那从之前互联网获取数据的公司，他们训练的模型更能代表现实世界。所以，开始那一波大模型算是有了先发优势。

对于这一观点，你怎么看呢？

文章出处：量子位

本文链接：http://www.28at.com/showinfo-17-104051-0.htmlNature封面：AI训AI 越训越傻

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：雷军身披雨衣现身巴黎奥运开幕式：一个难忘的夜晚

下一篇：跳水首金观众席上的中国人沸腾了：祝贺陈艺文/昌雅妮

标签：

热门焦点

鸿蒙OS 4.0公测机型公布：甚至连nova6都支持

华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场，官方在发布会之前也已经正式给出了可升级的机型产品，这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
太卷！Redmi MAX 100英寸电视便宜了：12999元买Redmi史上最大屏

8月5日消息，从小米商城了解到，Redmi MAX 100英寸巨屏电视日前迎来官方优惠，到手价12999元，比发布价便宜了7000元，在大屏电视市场开卷。据了解，Redmi MAX 100
把LangChain跑起来的三个方法

使用LangChain开发LLM应用时，需要机器进行GLM部署，好多同学第一步就被劝退了，那么如何绕过这个步骤先学习LLM模型的应用，对Langchain进行快速上手？本片讲解3个把LangChain跑起来
消息称小米汽车开始筛选交付中心：需至少120个车位

IT之家 7 月 7 日消息，日前，有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者发文表示，据经销商集团反馈，小米汽车目前
华为Mate 60保护壳曝光：硕大后置相机模组凸起程度有惊喜

这段时间以来，关于华为新旗舰的爆料日渐密集。据此前多方爆料，今年华为将开始恢复一年双旗舰战略，除上半年推出的P60系列外，往年下半年的Mate系列也将
华为Mate 60系列用上可变灵动岛：正式版体验将会更出色

这段时间以来，关于华为新旗舰的爆料日渐密集。据此前多方爆料，今年华为将开始恢复一年双旗舰战略，除上半年推出的P60系列外，往年下半年的Mate系列也将
三星Galaxy Z Fold5官方渲染图曝光：13.4mm折叠厚度依旧感人

据官方此前宣布，三星将于7月26日在韩国首尔举办Unpacked活动，届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy Z Flip 5、
到手价3099元起！iQOO Neo8 Pro今日首销：安卓性能最强旗舰

5月23日，iQOO如期举行了新品发布会，全新的iQOO Neo8系列也正式与大家见面，包含iQOO Neo8和iQOO Neo8 Pro两个版本，其中标准版搭载高通骁龙8+，而Pro版更
iQOO Neo8 Pro真机谍照曝光：天玑9200+和V1+旗舰双芯加持

去年10月，iQOO推出了iQOO Neo7系列机型，不仅搭载了天玑9000+，而且是同价位唯一一款天玑9000+直屏旗舰，一经上市便受到了用户的广泛关注。在时隔半年后，

Nature封面：AI训AI 越训越傻

鸿蒙OS 4.0公测机型公布：甚至连nova6都支持

太卷！Redmi MAX 100英寸电视便宜了：12999元买Redmi史上最大屏

把LangChain跑起来的三个方法

消息称小米汽车开始筛选交付中心：需至少120个车位

华为Mate 60保护壳曝光：硕大后置相机模组凸起程度有惊喜

华为Mate 60系列用上可变灵动岛：正式版体验将会更出色

三星Galaxy Z Fold5官方渲染图曝光：13.4mm折叠厚度依旧感人

到手价3099元起！iQOO Neo8 Pro今日首销：安卓性能最强旗舰

iQOO Neo8 Pro真机谍照曝光：天玑9200+和V1+旗舰双芯加持

最新推荐

猜你喜欢

热门推荐

相关资讯