当前位置:首页 > 元宇宙 > AI

GPT-4:突破巨大参数规模的下一步之旅

来源: 责编: 时间:2023-08-15 18:48:15 369观看
导读07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。据悉,GPT-4采用了混合

07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。1Cy28资讯网——每日最新资讯28at.com

据悉,GPT-4采用了混合专家模型,这种模型利用数据进行训练,将多个模型分别训练后,将它们的输出整合为一个单独的任务。为了保持合理的成本,OpenAI选择了这种方式进行构建。GPT-4总共有120层,包含了1.8万亿个参数,相比之下,GPT-3只有约1750亿个参数,可见其在规模上的巨大提升。1Cy28资讯网——每日最新资讯28at.com

1Cy28资讯网——每日最新资讯28at.com

GPT-4使用了16个混合专家模型,每个模型拥有1110亿个参数,并且每次前向传递路由都会经过两个专家模型。此外,它还拥有550亿个共享注意力参数。为了进行训练,OpenAI使用了一个包含13万亿个tokens的数据集,这些tokens并非唯一,而是根据迭代次数计算出更多的tokens。1Cy28资讯网——每日最新资讯28at.com

1Cy28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,GPT-4在预训练阶段的上下文长度为8k,32k版本则是对8k版本的微调结果。然而,GPT-4的训练成本非常高昂。根据外媒报道,即使使用了8倍H100物理机,也无法以每秒33.33个token的速度提供所需的密集参数模型。据估算,一次GPT-4的训练成本高达6300万美元(约4.51亿元人民币)。1Cy28资讯网——每日最新资讯28at.com

为了降低训练成本,OpenAI选择在云端使用A100GPU进行模型训练,最终将训练成本降低至大约2150万美元(约1.54亿元人民币),尽管需要更长的时间来完成训练过程。这一举措在一定程度上减轻了训练成本的压力。1Cy28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-999-0.htmlGPT-4:突破巨大参数规模的下一步之旅

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 前沿技术、机器人和集成电路成为人工智能领域热门融资领域

下一篇: 新一代AI笔记应用Notebook LM亮相:优化信息整理与解答需求

标签:
  • 热门焦点
  • 【东方证券】虚拟世界照进现实,元宇宙中有什么? | 元宇宙Meta洞见

    元宇宙的表现形式大多以游戏为起点,并逐渐整合互联网、数字化娱乐、社交网络等功能,长期来看甚至可以整合社会经济与商业活动。元宇宙的发展最关键的部分在于元
  • 字节跳动,刚刚投了一位虚拟女生

    今年第一笔虚拟人融资出炉了。投资界获悉,杭州李未可科技有限公司显示发生股东变更,新增字节跳动关联公司北京量子跃动科技有限公司。今天公司方面正式确认,本轮
  • 超跑与NFT的首次结合,兰博基尼能否破局?

    兰博基尼公司近日称即将推出它的首款NFT,并且将加速进军区块链领域。这家闻名遐迩的意大利汽车厂商野心勃勃地将目光投向混合动力和电动跑车,并宣布将拍卖与瑞士
  • 超级碗的加密时刻:是主流信号还是“网络超级碗2.0”?

    2 月 13 日,美东时间 18:30,有着“美国春晚”之誉的超级碗(Super Bowl)落下帷幕。超级碗是美国国家美式足球联盟(也称为国家橄榄球联盟)的年度冠军赛,胜者将成为“世
  • 从冰墩墩到无聊猿,解秘未来IP爆款的模因

    打造IP,是建设元宇宙的刚需。NFT能直接让IP的价值变现;虚拟人IP是元宇宙的第一入口,而元宇宙要搭建的,就是一个个品牌IP星球,考验的是IP世界观的建设能力。如果说在
  • 元宇宙是数字共识生态的集成逻辑表达

    作者: 李鸣元宇宙是数字共识生态的集成逻辑表达,是以区块链技术为核心的可信数字化价值交互网络,是基于Web3.0技术体系和运作机制支撑下的数字新生态。本体论是
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • 大厂打造元宇宙平台的业务重心是什么?

    知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告,其中提出互联网大厂各自独立布局元宇宙平台。事实上,在2021年的最后一个季度,包括Meta、英伟达、
  • 从概念到落地 Web3.0初具雏形

    加密资产热潮催生出的链上应用中,除了DeFi、NFT、链游GameFi等场景外,还有一个热词叫「Web3.0」。Web3.0的概念最早出现在2014年,由以太坊联合创始人及波卡创建者
Top