当前位置:首页 > 元宇宙 > AI

GPT-4:突破巨大参数规模的下一步之旅

来源: 责编: 时间:2023-08-15 18:48:15 424观看
导读07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。据悉,GPT-4采用了混合

07月13日消息,外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露,GPT-4在架构和参数方面有着显著的提升,以及采用了混合专家模型(Mixtureof Experts)的构建方式。W5z28资讯网——每日最新资讯28at.com

据悉,GPT-4采用了混合专家模型,这种模型利用数据进行训练,将多个模型分别训练后,将它们的输出整合为一个单独的任务。为了保持合理的成本,OpenAI选择了这种方式进行构建。GPT-4总共有120层,包含了1.8万亿个参数,相比之下,GPT-3只有约1750亿个参数,可见其在规模上的巨大提升。W5z28资讯网——每日最新资讯28at.com

W5z28资讯网——每日最新资讯28at.com

GPT-4使用了16个混合专家模型,每个模型拥有1110亿个参数,并且每次前向传递路由都会经过两个专家模型。此外,它还拥有550亿个共享注意力参数。为了进行训练,OpenAI使用了一个包含13万亿个tokens的数据集,这些tokens并非唯一,而是根据迭代次数计算出更多的tokens。W5z28资讯网——每日最新资讯28at.com

W5z28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,GPT-4在预训练阶段的上下文长度为8k,32k版本则是对8k版本的微调结果。然而,GPT-4的训练成本非常高昂。根据外媒报道,即使使用了8倍H100物理机,也无法以每秒33.33个token的速度提供所需的密集参数模型。据估算,一次GPT-4的训练成本高达6300万美元(约4.51亿元人民币)。W5z28资讯网——每日最新资讯28at.com

为了降低训练成本,OpenAI选择在云端使用A100GPU进行模型训练,最终将训练成本降低至大约2150万美元(约1.54亿元人民币),尽管需要更长的时间来完成训练过程。这一举措在一定程度上减轻了训练成本的压力。W5z28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-999-0.htmlGPT-4:突破巨大参数规模的下一步之旅

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 前沿技术、机器人和集成电路成为人工智能领域热门融资领域

下一篇: 新一代AI笔记应用Notebook LM亮相:优化信息整理与解答需求

标签:
  • 热门焦点
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 2022年最具关注的9个头像NFT项目

    什么是 PFP NFT 项目?PFP NFT (个人资料图片NFT)是一组独特的数字收藏品,人们用来在互联网平台上代表自己。这些数字艺术作品通常是一系列可作为头像的角色,在 Twit
  • Web3 去中心化身份管理系统的历史、现状与展望

    身份、数字资产和在线资料的映射最近在区块链行业获得了极大的关注。新技术正在形成架构,这将进一步为去中心化和以用户为中心的机制铺平道路。本文将讨论以下
  • 小众有趣NFT艺术作品欣赏(1)

    随着NFT发展火热,越来越多领域与NFT融合,NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处,也有完全不同的地方。NFT艺术与传统艺术一样,表现了
  • 暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗?

    NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造,该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
  • 元宇宙画廊体验报告:有点头疼。

    2 月 10 日,Hrishi Rajasekar 在旧金山铸币厂的沉浸式 NFT 展览 Verse 观看增强现实艺术品。“我们现在在虚拟世界中吗?时间好像变长了” 我问身后排队的人。我
  • 利用元宇宙平台10天收入160万,风口还是虎口?

    美国Meta平台有限公司,也就是原来的脸书公司,9日宣布,公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象
  • Ceramic:为Web3.0社交应用打造的中间件

    大家关注老雅痞公众号这么久,对Web3的概念不陌生吧?让我们做一个简短的回顾,Web3主要被描述为去中心化的网络,旨在实现无服务器、去中心化的互联网,即用户掌握自己
  • 初探元宇宙

    2021年可以被称为“元宇宙”元年。继2021年3月沙盒游戏平台Roblox将“元宇宙”概念放入招股书中,被称为“元宇宙”第一股后,Facebook更名为Meta, 引发全球范围内
Top