当前位置:首页 > 元宇宙 > AI

散户组团挑战算力霸权,40B 模型 + 20 万亿 token 刷新世界纪录

来源: 责编: 时间:2025-05-28 09:21:49 188观看
导读 互联网上最大规模的预训练来了!Nous Research 宣布正式推出 Psyche 网络(Psyche Network),通过去中心化方式革新人工智能(AI)训练。Psyche 网络利用区块链技术,汇聚全球计算资源,成功启动了 40B 参数大语言模型 Consi

互联网上最大规模的预训练来了!xHU28资讯网——每日最新资讯28at.com

Nous Research 宣布正式推出 Psyche 网络(Psyche Network),通过去中心化方式革新人工智能(AI)训练。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

Psyche 网络利用区块链技术,汇聚全球计算资源,成功启动了 40B 参数大语言模型 Consilience 的预训练任务,总计 20 万亿 token,创下了迄今为止互联网上最大规模的预训练纪录。xHU28资讯网——每日最新资讯28at.com

大语言模型 Consilience 采用 DeepSeek V3 的多头潜在注意力(MLA)架构,相较于 Llama 使用的 GQA 架构更具表达力,同时通过优化 QKV 投影矩阵减少计算开销。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

▲三种注意力的对比

Psyche 利用全球闲置的计算资源(如 4090、A100 和 H100 等消费级 GPU),大幅降低训练成本。xHU28资讯网——每日最新资讯28at.com

通过并行实验,Psyche 鼓励开源社区提出新的模型架构和训练方法,未来可能催生更多创新。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

▲Psyche 网络技术原理图,核心在于 DisTrO 优化器与 Solana 区块链

过去,人们总觉得「AI 模型的去中心化训练」不过是一种幻想,尤其在那些超越了爱好者规模的语言模型面前更是如此。xHU28资讯网——每日最新资讯28at.com

但几项关键技术突破 —— 尤其是并行化和强化学习 —— 正在逐渐打破这种局限,让除了 OpenAI、Anthropic 这类大公司之外的小型团队也开始进入这个赛道。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

现在看来,聪明的算法可以弥补基础设施的不足,而像 Nous Research 这样的去中心化参与者正希望抓住这个机会。xHU28资讯网——每日最新资讯28at.com

砸碎算力墙

近年来,AI 模型的训练逐渐被大型科技公司垄断。xHU28资讯网——每日最新资讯28at.com

训练一个前沿模型需要数千个高性能 GPU 和超高带宽的集群,这使得普通研究者或小型团队几乎无法参与。xHU28资讯网——每日最新资讯28at.com

这种集中化趋势不仅限制了创新,还可能导致少数科技去投垄断甚至控制 AI 模型。xHU28资讯网——每日最新资讯28at.com

集中式 AI,可能会少数科技巨头「比你更了解你自己」。xHU28资讯网——每日最新资讯28at.com

Hermes 系列中规模最大的模型 ——Hermes 3 405B,是在基础的 Llama 3.1 模型上进行微调完成的。xHU28资讯网——每日最新资讯28at.com

整个训练过程动用了 128 块 H100 GPU,耗时约 16 小时(总计约 2,086GPU 小时)。xHU28资讯网——每日最新资讯28at.com

从成本上看其实并不离谱 —— 目前租用 8 块 H100 的计算节点每小时大约在 16 到 24 美元之间,因此一次完整训练的开销大约在 5,000 美元左右。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

作为 Nous Research Hermes 系列的最新迭代,Hermes 3 405B 自 Llama-3.1 405B 的全参数微调模型,xHU28资讯网——每日最新资讯28at.com

但如果我们想更进一步,想得更大呢?xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

毕竟,Hermes 目前还是依赖 Llama 作为基础模型。xHU28资讯网——每日最新资讯28at.com

如果我们不再依赖已有的模型,而是从零开始构建自己的基础模型,那我们就需要更庞大的“船”了。xHU28资讯网——每日最新资讯28at.com

要以更大规模、低成本地实现类似的训练成果,确实面临不少挑战,尤其是当训练从集中化的 GPU 集群转向基于互联网的去中心化网络时。xHU28资讯网——每日最新资讯28at.com

Nous Research 提出了 Psyche 网络的解决方案:通过去中心化的方式,让全球的计算资源参与 AI 模型训练,降低进入门槛,推动 AI 发展的民主化。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

Nous Research 的 Psyche 网络成功实现了去中心化的 AI 训练,开创了一个全新的模式。xHU28资讯网——每日最新资讯28at.com

Psyche 不仅降低了 AI 开发的门槛,还推动了全球协作和创新。xHU28资讯网——每日最新资讯28at.com

Consilience 模型的预训练只是起点,未来 Psyche 网络有望成为 AI 民主化的重要基石,为开源社区和小型团队提供与科技巨头抗衡的机会。xHU28资讯网——每日最新资讯28at.com

用 DisTrO 解决带宽瓶颈

在去中心化训练中,网络带宽一直是最令人担忧的问题之一。xHU28资讯网——每日最新资讯28at.com

在传统的数据中心里,GPU 之间通过极高带宽的连接(如 NVLink 或 InfiniBand)相连,带宽可达每秒几百 Gb(千兆位)。xHU28资讯网——每日最新资讯28at.com

而相比之下,互联网上的志愿者节点,往往只有几十甚至几百 Mb(兆位)每秒的带宽。xHU28资讯网——每日最新资讯28at.com

质疑者认为,这种高达 100 倍甚至 1,000 倍的带宽差距,会让跨互联网的 AI 训练变得无比缓慢、几乎不可能。xHU28资讯网——每日最新资讯28at.com

毕竟,传统的训练方式需要 GPU 之间持续地交换更新信息,而如果试图用普通家用网络来完成这些通信,很可能会陷入「灾难级」的训练体验。xHU28资讯网——每日最新资讯28at.com

在此前对 DeMo(Decoupled Momentum Optimization)的研究基础上,Nous 推出的 DisTrO 技术,能够让所有训练节点保持高度同步,同时将所需带宽降低 1,000 到 10,000 倍。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

2024 年 12 月,Nous 与多位合作伙伴一起,在封闭测试网中,训练了一个 150 亿参数的基础模型,并成功验证了多项理论设想:xHU28资讯网——每日最新资讯28at.com

首次将 DisTrO 优化器系列大规模应用于训练任务xHU28资讯网——每日最新资讯28at.com

验证了节点中途掉线和新增节点时的容错能力xHU28资讯网——每日最新资讯28at.com

证明了增加训练节点确实能提升整体训练速度xHU28资讯网——每日最新资讯28at.com

这次实验标志着分布式、去中心化训练迈出了从理论走向现实的关键一步。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

区块链 + AI

在硅谷的一些圈子里,「加密」这个词几乎成了贬义词,而 Nous 一直努力保持与 AI 开发者之间的开放交流桥梁不被切断。xHU28资讯网——每日最新资讯28at.com

也正因如此,他们这次将 Psyche 搭建在区块链上,是一个值得关注的重要转变。xHU28资讯网——每日最新资讯28at.com

Psyche 将成为 Nous 用于预训练、微调和部署下一代模型的平台。xHU28资讯网——每日最新资讯28at.com

通过将技术栈迁移到 Solana 区块链,Nous 希望释放区块链的以下三大优势:xHU28资讯网——每日最新资讯28at.com

无需许可:任何人都可以贡献计算资源xHU28资讯网——每日最新资讯28at.com

弹性与高可用性:不再依赖中心化基础设施xHU28资讯网——每日最新资讯28at.com

激励机制:协调并奖励为网络作出贡献的参与者xHU28资讯网——每日最新资讯28at.com

将这一协议向整个市场开放,意味着任何人都能拥有其中的一部分。而其潜在的扩展性之大,显然已经让不少极客兴奋不已。xHU28资讯网——每日最新资讯28at.com

计划概览

Nous 的初期目标是先上线一个封闭测试网(Phase 0),验证是否能在 Solana 上运行一个更大规模、分布式、具备容错能力的 DisTrO 系统。后续阶段会逐步引入更高级的功能。xHU28资讯网——每日最新资讯28at.com

在 Phase 0 阶段,贡献者可以携带自己的 GPU 加入进来(明确提到支持 4090、A100 和 H100 等型号),并开始获得奖励。此阶段会对参与者进行筛选,以防止恶意行为者加入。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

一旦系统稳定运行,权限将逐步开放,允许不同类型的计算资源(无论是专业的还是消费级的)自由接入网络,协助训练 Llama、Diffusion 等不同类型的模型架构。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

强化学习后训练阶段

强化学习(Reinforcement Learning,RL)不依赖于预先准备好的数据集,而是通过模型与环境直接互动来学习。xHU28资讯网——每日最新资讯28at.com

每个节点如果做出有助于模型进化的行为,就会获得正反馈,反之则获得负反馈。xHU28资讯网——每日最新资讯28at.com

由于这些节点可以异步运行,分布式训练在强化学习框架下反而运行良好。xHU28资讯网——每日最新资讯28at.com

每个节点可以独立行动,收集经验,并定期与其他节点分享进展。xHU28资讯网——每日最新资讯28at.com

这极大缓解了传统训练中常见的「同步难题」,特别是在硬件能力和网络延迟差异大的情况下。xHU28资讯网——每日最新资讯28at.com

通过 RL,Psyche 上的预训练模型可以进一步学会推理能力和领域知识。xHU28资讯网——每日最新资讯28at.com

而每个 Psyche 节点在训练过程中的表现都将影响它的奖励:计算能力更强或使用了更先进训练方法的节点,可能会获得更多代币激励。xHU28资讯网——每日最新资讯28at.com

xHU28资讯网——每日最新资讯28at.com

区块链:回归初心

在常常被斥为「过度炒作又频频令人失望」的区块链生态中,能看到真正的创新成果,确实令人欣慰 —— 简直让人「冷漠的灵魂也重新燃起了热情」。xHU28资讯网——每日最新资讯28at.com

这一切,真的令人感到振奋。xHU28资讯网——每日最新资讯28at.com

Nous 并不是一开始就拥抱区块链技术的,相反,他们几乎是被「拖着、踢着、喊着」走上了这条路 ——xHU28资讯网——每日最新资讯28at.com

但原因很简单:区块链确实是解决他们问题最合适的工具。xHU28资讯网——每日最新资讯28at.com

他们需要一种方式,不论对方来自哪里,都能吸引计算资源与人才并进行公平支付;区块链,在这一点上表现得无比出色。xHU28资讯网——每日最新资讯28at.com

他们需要一种手段,能够协调并扩展大规模训练任务;而协调与扩展,正是区块链技术的「第二天性」。xHU28资讯网——每日最新资讯28at.com

他们还需要一种不受停电、封禁、宕机等影响的托管机制,能让项目「打不死」、无法被关闭;在这方面,区块链(这次不再是讽刺)也的确提供了最可靠的保障。xHU28资讯网——每日最新资讯28at.com

而最值得欣慰的是:这一次,人们选择区块链,不是出于投机炒作,而是出于对实际问题的认真思考与真实需求的回应。xHU28资讯网——每日最新资讯28at.com

如果 Psyche 成功了,它不仅将证明去中心化训练是切实可行的,更是回归初心:为取代的集中化计算,提供了强有力的工具。xHU28资讯网——每日最新资讯28at.com

参考资料:xHU28资讯网——每日最新资讯28at.com

https://x.com/NousResearch/status/1922744483571171605xHU28资讯网——每日最新资讯28at.com

https://nousresearch.com/nous-psyche/xHU28资讯网——每日最新资讯28at.com

https://x.com/563defi/status/1909976170990313594xHU28资讯网——每日最新资讯28at.com

本文来自微信公众号:新智元(ID:AI_era),原标题《刷新世界记录!40B 模型 + 20 万亿 token,散户组团挑战算力霸权》xHU28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13220-0.html散户组团挑战算力霸权,40B 模型 + 20 万亿 token 刷新世界纪录

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 2025端午档票房大热!《时间之子》领跑,与《碟中谍8》共掀观影潮

下一篇: 全球首款 Office 智能体:昆仑万维天工超级智能体 App 上线

标签:
  • 热门焦点
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 三院士三教授热聊元宇宙&——AIGC,学术界怎么看?

    来源:清元宇宙在近日举办的中国江宁2023元宇宙产业·人才高峰论坛暨AIGC发展大会上,中国工程院院士谭建荣、刘韵洁、郑纬民出席并发表了主旨演讲。除了三大院士,还有清华
  • 沉寂3年,大模型激活小度天猫精灵?

    Tech星球(微信ID:tech618)文 | 何煦阳 沉寂了许久的智能音箱,在今年大模型横空出世之后,又再次燃起了新的希望。 2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型&ldq
  • VR/AR迷失元宇宙“硝烟”

    不温不火的VR/AR可穿戴设备因元宇宙崛起火了一阵,又随着元宇宙回归平静。1月份,微软在 Surface 设备、HoloLens 混合现实硬件和 Xbox 等部门裁员,其中负责混合现实硬件(MR)的Holo
  • 一个视频涨粉百万,柳夜熙们能成为元宇宙的“船票”吗?

    当数字人成为一种生意,我们更关心的是,他们如何赚到钱,以及这意味着什么?01#“柳夜熙”爆火之后不知道大家还记不记得,去年10月31日万圣节,有一位虚拟美妆
  • 元宇宙将会如何塑造未来的工作方式?

    科幻小说家尼尔·斯蒂芬森 (Neal Stephenson) 在1992年就创造了“元宇宙”一词,但事实上,在Facebook将其更名为Meta以反映其将这一科幻愿景变为现实的战略重点之
  • 2030年的元宇宙产业将会如何发展?

    对互联网巨头传统业务的反垄断政策倒逼互联网企业颠覆创新,寻找新的增长点,移动互联网流量空间见顶之际,元宇宙时代红利已然开启。序章:元宇宙应用场景大猜想元宇
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
  • 赵长鹏预测SoicalFi为今年主要驱动力,新的机会在哪里?

    作者:五火球教主前不久,赵长鹏在《财富》杂志印度版块刊登评论。他表示:“DeFi 在 2021 年出现了快速创新,我们可能会在 2022 年看到蓬勃发展的兴趣和创新,其中 Soc
Top