当前位置：首页 > 元宇宙 > AI

我国首个：类脑脉冲大模型“瞬悉 1.0”问世，在国产 GPU 算力平台完成训练推理

来源：责编：时间：2025-09-11 11:27:45 113观看

导读 9 月 8 日消息，中国科学院自动化研究所今日官宣，该所李国齐、徐波团队在发表原创内生复杂性理论系列论文的工作基础上，与沐曦 MetaX 合作，打造了类脑脉冲大模型“瞬悉 1.0”（SpikingBrain-1.0），在国产千卡 GPU 算力

9 月 8 日消息，中国科学院自动化研究所今日官宣，该所李国齐、徐波团队在发表原创内生复杂性理论系列论文的工作基础上，与沐曦 MetaX 合作，打造了类脑脉冲大模型“瞬悉 1.0”（SpikingBrain-1.0），在国产千卡 GPU 算力平台上完成全流程训练和推理，实现了大模型在超长序列推理上数量级的效率和速度提升，展示了构建国产自主可控的新型非 Transformer 大模型架构生态的可行性。

研究团队开源了 SpikingBrain-1.0-7B 模型并开放 SpikingBrain-1.0-76B 测试网址，同步公开了经工业界大规模验证的类脑脉冲大模型 SpikingBrain-1.0 中英文技术报告。

当前，基于 Transformer 架构的大模型在 Scaling law 驱动下，通过增加网络规模、算力资源和数据量提升模型智能水平，但模型的基本计算单元为简单的点神经元模型，我们将此路径称为“基于外生复杂性”的通用智能实现方法。Transformer 架构的固有缺点训练时开销随序列长度呈平方级增长以及推理时显存占用也随序列长度线性增加，构成了资源消耗的主要瓶颈，导致其处理超长序列的能力受限。

研发团队借鉴大脑神经元内部复杂工作机制提出“基于内生复杂性”的大模型构架方式，打造类脑脉冲大模型“瞬悉 1.0”（ SpikingBrain-1.0），在理论上建立了脉冲神经元内生动力学与线性注意力模型之间的联系，揭示了现有线性注意力机制是树突计算的特殊简化形式，从而清晰地展示了一条不断提升模型复杂度和性能的新型可行路径。

研发团队进而构建并开源了基于脉冲神经元、具有线性（SpikingBrain-1.0-7B）及混合线性复杂度（SpikingBrain-1.0-76B，激活参数量 12B）的新型类脑基础模型，开发了面向国产 GPU（沐曦 MetaX 曦云 C550）集群高效训练和推理框架、Triton 算子库、模型并行策略以及集群通信原语。

SpikingBrain-1.0 在多个核心性能上实现突破：

第一，极低数据量上的高效训练：训练阶段具有线性或近线性复杂度，显著提升长序列训练效率，并能依托高效转换训练范式，以约为主流大模型 2% 的预训练数据量实现与众多开源 Transformer 模型在多任务语言理解（MMLU）, 中文多任务语言理解（CMMLU、Ceval）, 常识推理能力（ARC、HS）任务上相媲美的性能。

第二，推理效率的数量级提升：推理阶段结合脉冲神经元事件驱动特性，SpikingBrain 具有常数或部分层常数级别的复杂度和存储开销，SpikingBrain-7B 模型在 100 万 Token 长度下 TTFT（生成第一个 Token 所需时间）相比 Transformer 架构加速达到 26.5 倍，400 万 Token 长度下加速超过 100 倍。同时在手机 CPU 端 64k-128k-256k 长度下较 Llama3.2 的同规模模型 Decoding 速度提升 4.04x-7.52x-15.39x，在超长序列处理能力上展现出数量级的效率和速度提升。

第三，国产自主可控类脑大模型生态的构建：SpikingBrain 适配了面向国产 GPU 集群的高效训练和推理框架、Triton 算子库、模型并行策略以及集群通信原语，表明了构建国产自主可控的新型非 Transformer 大模型架构生态的可行性。

第四，基于动态阈值脉冲化的多尺度稀疏机制：设计细粒度的两阶段动态阈值脉冲化策略，结合粗粒度的混合专家模型（MoE）方案，在 7B 模型上实现了超过 69.15% 的稀疏度，长序脉冲占比约 1.85%，为低功耗的类脑大模型运行提供有力支撑。

中国科学院自动化研究所表示，这是我国首次提出大规模类脑线性基础模型架构、并首次在国产 GPU 算力集群上构建类脑脉冲大模型的训练和推理框架。提出的模型解决了脉冲驱动限制下的大规模类脑模型性能退化问题，其超长序列处理能力在法律 / 医学文档分析、复杂多智能体模拟、高能粒子物理实验、DNA 序列分析、分子动力学轨迹等超长序列任务建模场景中具有显著的潜在效率优势。本次发布的大模型为新一代人工智能发展提供了非 Transformer 架构的新技术路线，并将启迪更低功耗的下一代神经形态计算理论和芯片设计。

附 SpikingBrain-1.0-7B 开源地址：

https://github.com/BICLab/SpikingBrain-7B

试用网站：

https://controller-fold-injuries-thick.trycloudflare.com

本文链接：http://www.28at.com/showinfo-45-27451-0.html我国首个：类脑脉冲大模型“瞬悉 1.0”问世，在国产 GPU 算力平台完成训练推理

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：英伟达推出通用深度研究系统：可接入任何 LLM，支持个人定制

下一篇：傅利叶首款陪伴机器人 GR-3 开启预售：身高 165cm，全身柔肤软包

标签：

热门焦点

数字人的AB面：在元宇宙中过气，在AIGC中重生

来源：光锥智能作者：郝鑫“29800元一年的虚拟主播，号称24小时不停播，月入十几万，实际上却是关键词都不能回复，播了半个月，直播间还因违规被快手封禁，最终投诉无门、退款无果。&
“平均时代”：ChatGPT模仿秀的隐喻

来源：锦缎如果你问ChatGPT，Instagram上最美的女人是谁？它很可能会给你一个名字，叫卡戴珊。如果你观察过Instagram这个美版小红书：平台上的所有网红，展现的几乎是统一面孔：统一的医
中国虚拟数字人如何横向拓展市场需求，探索发展场景?

通过5G、AI等新技术更新换代，虚拟数字人为诸多下游行业带来新的发展机会。虚拟数字人技术以其简化性和精品性持续拓展泛娱乐、金融、教育、政务、医疗、零售等
高通成立欧洲XR实验室；ICICB计划进军元宇宙......

扩展现实（XR）通过计算机将真实与虚拟相结合，打造了一个可人机交互的虚拟环境，将AR、VR、MR多种技术相融合，为体验者带来了虚拟世界与现实世界之间无缝转换的“沉浸
NFT盗窃案：为什么NFT市场被盗窃和黑客所困扰？

Block-806NFT的增长值得关注。许多人愿意为数字艺术支付数百万美元，世界正在走向数字化。报告显示，NFT市场和NFT收藏从2020年的1.06亿美元增加到了2021年的442亿
与元宇宙美少女艺术家的对话

我最近宣布了我自己的NFT项目，这是我已经工作了几个月的事情。由于我之前只是一个收藏家，拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
下一个黄金赛道？NFT的碎片化!

碎片化可能是我们一生中最重要的一个投资趋势，碎片化本身并不新鲜。它已经存在了400年之久。早在1602年，荷兰东印度公司是历史上第一家在公共证券交易所上市的公
这个好莱坞影视制作公司涉足NFT，让持有者在制作中发挥作用

前米高梅首席执行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一个新的好莱坞工作室，提供 NFT，让持有者在制作中发挥作用Electromagnetic Productions 创始
初探元宇宙

2021年可以被称为“元宇宙”元年。继2021年3月沙盒游戏平台Roblox将“元宇宙”概念放入招股书中，被称为“元宇宙”第一股后，Facebook更名为Meta, 引发全球范围内

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

我国首个：类脑脉冲大模型“瞬悉 1.0”问世，在国产 GPU 算力平台完成训练推理

数字人的AB面：在元宇宙中过气，在AIGC中重生

“平均时代”：ChatGPT模仿秀的隐喻

中国虚拟数字人如何横向拓展市场需求，探索发展场景?

高通成立欧洲XR实验室；ICICB计划进军元宇宙......

NFT盗窃案：为什么NFT市场被盗窃和黑客所困扰？

与元宇宙美少女艺术家的对话

下一个黄金赛道？NFT的碎片化!

这个好莱坞影视制作公司涉足NFT，让持有者在制作中发挥作用

初探元宇宙

最新推荐

元娲2.7上线：虚拟人视频制作速度疯狂翻倍！

元宇宙里卖酸奶，好炸裂的操作！

区块链产业人才发展报告

NFT高玩必备：NFT分析工具大盘点

虚拟邓丽君后，数字人赛道开启3.0时代

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

猜你喜欢

热门推荐

相关资讯