当前位置:首页 > 元宇宙 > AI

Alpaca Formula微调模型研究争议:开源模型与ChatGPT存在性能差距

来源: 责编: 时间:2023-08-15 18:50:26 352观看
导读5月29日消息,开源语言模型的发展取得了令人瞩目的进步。然而,对于这些开源模型是否能够与来自OpenAI、谷歌和其他公司的经过精心训练的语言模型竞争,存在一些争议。据先前报道,使用Alpaca Formula训练的开源语言模型几乎

5月29日消息,开源语言模型的发展取得了令人瞩目的进步。然而,对于这些开源模型是否能够与来自OpenAI、谷歌和其他公司的经过精心训练的语言模型竞争,存在一些争议。iPE28资讯网——每日最新资讯28at.com

据先前报道,使用Alpaca Formula训练的开源语言模型几乎不需要耗费大量时间和资源,就能够达到类似于ChatGPT的水平。AlpacaFormula是指开发者利用ChatGPT生成的训练数据来微调meta语言模型LLaMA。通过使用这些数据,LLaMA模型能够在短时间内学习生成与ChatGPT相似的输出,且所需计算资源较少。iPE28资讯网——每日最新资讯28at.com

然而,最近伯克利大学的研究人员对此进行了不同的研究。他们使用AlpacaFormula对LLaMA和GPT-2的一些基础模型进行了实验,并请人工评估这些结果,同时还使用GPT-4进行自动评估。iPE28资讯网——每日最新资讯28at.com

初步结果与之前的开发者所得出的结论相似:改进过的模仿模型在展示模仿数据的任务中的性能远超基础模型,与ChatGPT相当。iPE28资讯网——每日最新资讯28at.com

然而,更加有针对性的自动评估显示,这些模仿模型实际上只在已见过的模仿数据的任务中表现良好。在其他领域中,与GPT-4相比,仍然存在明显的性能差距。这是因为这些基础模型在广泛的预训练过程中获取了大部分功能,而非微调阶段所获得的。iPE28资讯网——每日最新资讯28at.com

研究人员指出,进行这种评估的工作者常常在短时间内对人工智能内容进行评估,而缺乏相关专业知识,容易被误导。iPE28资讯网——每日最新资讯28at.com

值得注意的是,OpenAI的研究员约翰舒尔曼最近批评了使用ChatGPT数据来微调开源基础语言模型的做法。他指出,如果微调数据集中包含了原始模型中未包含的知识,那么这些模型可能会产生更多不准确的内容。iPE28资讯网——每日最新资讯28at.com

综上所述,虽然开源语言模型的进步不容忽视,但在与OpenAI、谷歌和其他公司训练有素的语言模型进行竞争时,仍然存在一定的差距。对于开源模型的评估需要更加准确和全面,以充分了解其性能和局限性。iPE28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-1326-0.htmlAlpaca Formula微调模型研究争议:开源模型与ChatGPT存在性能差距

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 大脑信号转化为高质量视频:MinD-Video技术引发研究热潮

下一篇: 英伟达推出定制AI模型代工服务ACE for Games,开启游戏创新新时代

标签:
  • 热门焦点
  • AI网红能年赚百万,普通人的新机会来了?

    来源|运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁2023 年 ,数字人成为了当红的“流量话题”和“商业机会"。不管是 AI 孙燕姿走红网络,还是 AI 数字
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 游戏玩家才是最“元宇宙”的

    01元宇宙的概念,最早由科幻作家尼尔·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一个脱胎于现实世界,又与现实世界平行、相互影响,并且始终在线的虚拟世
  • 高通成立欧洲XR实验室;ICICB计划进军元宇宙......

    扩展现实(XR)通过计算机将真实与虚拟相结合,打造了一个可人机交互的虚拟环境,将AR、VR、MR多种技术相融合,为体验者带来了虚拟世界与现实世界之间无缝转换的“沉浸
  • Web3 去中心化身份管理系统的历史、现状与展望

    身份、数字资产和在线资料的映射最近在区块链行业获得了极大的关注。新技术正在形成架构,这将进一步为去中心化和以用户为中心的机制铺平道路。本文将讨论以下
  • 2022年的Web3:定义概念并开创新范式

    Web3 是关于加密和区块链应该如何使用的概念,因为它是加密圈的一个离散子领域。社区机会将呈指数级增长,扩大这些子行业的人口统计范围。追求 Web3 项目的组织仍
  • 韩国国民银行将推出韩国首个加密货币 ETF

    韩国国民银行(Kookmin Bank)计划发行该国首个以散户投资者为主要关注点的加密货币投资基金。根据公告,该银行正在等待政府批准,并已建立一个准备就绪的数字资产
  • 以用户为中心,Web3和区块链如何将用户放在首位

    竞争优势正在改变竞争优势是每个企业都在努力争取的,由谷歌、Facebook和Netflix等大型科技公司主导的市场中,两大重要类别的竞争优势十分突出。第一个竞争优势来
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top