当前位置:首页 > 科技  > 网络

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了

来源: 责编: 时间:2023-11-01 09:17:55 437观看
导读 突然间,整个大模型圈都在谈论同一件事。微软论文里一张「乍一看不足为奇」的统计图,泄露了“天机”。引领全球风暴的ChatGPT,背后大模型参数竟只有200亿???论文一经发布,就吸引了国内外众多关注。不少网

突然间,整个大模型圈都在谈论同一件事。TK628资讯网——每日最新资讯28at.com

微软论文里一张「乍一看不足为奇」的统计图,泄露了“天机”。TK628资讯网——每日最新资讯28at.com

引领全球风暴的ChatGPT,背后大模型参数竟只有200亿???TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

论文一经发布,就吸引了国内外众多关注。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

不少网友还不相信:确定不是拼写错了?TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

有网友表示:难怪OpenAI对开源这么紧张。又或者,这也许是为OpenAI开源做准备。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

无独有偶,就在前几天有网友在GitHub Copilot的API中发现了疑似GPT-4新型号:copilot-gpt-4-2,所拥有的知识更新到了2023年3月。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

这篇论文说了啥?TK628资讯网——每日最新资讯28at.com

除了泄露机密,这篇论文本身也值得一看:业内首个用扩散模型做代码生成。TK628资讯网——每日最新资讯28at.com

研究团队设想了这样一个场景:TK628资讯网——每日最新资讯28at.com

如果开发人员只能修改后一行代码,那么需要多少次从头开始编写一个函数才能完成呢?TK628资讯网——每日最新资讯28at.com

用自然语言生成代码的自回归模型也有类似的局限性:不太容易重新考虑之前生成的tokens。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

微软研究员提出了采用编码-解码架构的CODEFUSION,主要包括编码器、解码器、去噪器以及Classification Head,将自然语言输入编码为连续表示,然后将其附加条件输入Diffusion模型中用高斯噪声进行迭代去噪。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

为了生成语法正确的代码,去噪后输入解码器中获得代码tokens,通过针对代码的连续段落去噪(CPD)任务预训练CODEFUSION。TK628资讯网——每日最新资讯28at.com

在Python、Bash和Excel条件格式化(CF)规则三个语言任务上评估了CODEFUSION。TK628资讯网——每日最新资讯28at.com

结果显示其7500万参数规模CODEFUSION性能,同200亿参数的GPT-3.5-turbo接近,而且还生成更加多样化的代码。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

与纯文本生成的diffusion模型相比,CODEFUSION生成更多语法正确的代码;与自动回归模型相比,生成更加多样化的候选代码。TK628资讯网——每日最新资讯28at.com

与先进的自回归系统(350M-175B 参数)相比,在前 1 名的准确率方面表现相当,而在前 3 名和前 5 名的准确率方面,由于其在多样性与质量之间取得了更好的平衡,其表现优于自回归系统。TK628资讯网——每日最新资讯28at.com

结果这原本只是一次再正常不过的性能比较,没想到引起轩然大波。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

也有人开始了阴谋论,或许这是OpenAI开源的“前菜”,故意而为之——TK628资讯网——每日最新资讯28at.com

因为不少大模型已经追赶上来了,而且早在今年5月,路透社就曾爆料OpenAI准备开源新大语言模型。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

One More ThingTK628资讯网——每日最新资讯28at.com

值得一提的是,早在今年2月份福布斯一则新闻报道里,就曾透露过ChatGPT只有200亿参数。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com

当时标题是「越大越好吗?为什么 ChatGPT VS GPT-3 VS GPT-4 的 “战斗 “只是一次家庭聊天?」TK628资讯网——每日最新资讯28at.com

只是当时没有太多人在意。TK628资讯网——每日最新资讯28at.com

ChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了TK628资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-16224-0.htmlChatGPT真实参数只有200亿 首次被微软曝光!网友惊:要开源了

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微信、抖音等多平台同日宣布!头部自媒体账号将实行前台实名

下一篇: 2000名学生决定包围诺贝尔奖得主

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    在今天下午的小米Civi 2新品发布会上,小米还带来了一款新的降噪蓝牙耳机Necklace,我们也在发布结束的第一时间给大家带来这款耳机的简单分享。现在大家能见到最多的蓝牙耳机
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 得物宠物生意「狂飙」,发力“它经济”

    作者|花花小萌主近日,得物宣布正式上线宠物鉴别,通过得物App内的“在线鉴别”,可找到鉴别宠物的选项。通过上传自家宠物的部位细节,就能收获拥有专业资质认证的得物鉴
  • 东方甄选单飞:有些鸟注定是关不住的

    文/彭宽鸿编辑/罗卿东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一年多时间里,东方甄选要脱离抖音自立门户的传闻不绝于耳,“7
  • 东方甄选单飞:有些鸟注定是关不住的

    作者:彭宽鸿来源:华尔街科技眼‍‍‍‍‍‍‍‍‍‍东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一
  • 三星获批量产iPhone 15全系屏幕:苹果史上最惊艳直屏

    按照惯例,苹果将继续在今年9月举办一年一度的秋季新品发布会,有传言称发布会将于9月12日举行,届时全新的iPhone 15系列将正式与大家见面,不出意外的话
  • 联想的ThinkBook Plus下一版曝光,键盘旁边塞个平板

    ThinkBook Plus 是联想的一个特殊笔记本类别,它在封面放入了一块墨水屏,也给人留下了较为深刻的印象。据有人爆料,联想的下一款 ThinkBook Plus 可能更特殊,它
Top