当前位置:首页 > 科技  > 手机

华为云Tokens服务接入384超节点,突破AI算力增长瓶颈

来源: 责编: 时间:2025-09-01 09:32:20 117观看
导读在第四届828 B2B企业节盛大开幕的当天下午,华为云传来了一则令人瞩目的消息:其Tokens服务已成功全面融入CloudMatrix384超节点,这一融合标志着华为云在AI算力领域的又一次重大突破。得益于xDeepServe架构的创新应用,华为

在第四届828 B2B企业节盛大开幕的当天下午,华为云传来了一则令人瞩目的消息:其Tokens服务已成功全面融入CloudMatrix384超节点,这一融合标志着华为云在AI算力领域的又一次重大突破。36928资讯网——每日最新资讯28at.com

得益于xDeepServe架构的创新应用,华为云Tokens服务的性能得到了显著提升。具体而言,该服务在单芯片上实现了2400TPS的吞吐量,同时保持了50ms的TPOT(Token处理时延),这一成绩无疑为AI算力的应用树立了新的标杆。36928资讯网——每日最新资讯28at.com

近年来,中国AI算力需求呈现出爆炸式增长。数据显示,从2024年初至2025年6月底,中国的日均Token消耗量从1000亿激增到30万亿,短短一年半时间内增长了300多倍。这一趋势对算力基础设施提出了前所未有的挑战。为了满足这一需求,华为云在2025年3月推出了基于MaaS(模型即服务)的Tokens服务,提供了多种规格以满足不同应用场景的需求。36928资讯网——每日最新资讯28at.com

36928资讯网——每日最新资讯28at.com

此次Tokens服务与CloudMatrix384超节点的结合,更是将这一服务的性能推向了新的高度。依托超节点的xDeepServe框架,Tokens服务的吞吐量从年初的1920TPS跃升至2400TPS。这一提升的背后,是华为云对于大算力构建全栈创新的深刻理解,包括硬件、软件、算子、存储、推理框架及超节点等各个环节的协同优化。36928资讯网——每日最新资讯28at.com

xDeepServe架构作为CloudMatrix384超节点的原生服务,其创新之处在于采用了Transformerless极致分离架构。这一架构将MoE大模型拆解为Attention、FFN、Expert三个可独立伸缩的微模块,并通过微秒级XCCL通信库与FlowServe自研推理引擎进行高效整合。经过这样的优化,单卡的吞吐量从非超节点的600tokens/s大幅提升至2400tokens/s。36928资讯网——每日最新资讯28at.com

36928资讯网——每日最新资讯28at.com

华为云还透露了xDeepServe架构的未来发展计划。目前,该架构已经实现了MA分离,未来还将进一步将Attention、MoE、Decode改造为数据流,并扩展至多台超节点,以实现推理吞吐的线性提升。36928资讯网——每日最新资讯28at.com

在应用层面,华为云Tokens服务已经支持了包括DeepSeek、Kimi、Qwen等在内的主流大模型,以及versatile、Dify等主流Agent平台。同时,华为云还与超过100家合作伙伴携手,在多个领域开发AI Agent,如调研分析、内容创作、智慧办公、智能运维等。这些应用不仅提升了服务效率与客户满意度,还推动了政企办公的智能化转型。36928资讯网——每日最新资讯28at.com

例如,基于MaaS平台的今日人才数智员工解决方案,通过集成自然语言处理、机器学习等技术,为企业提供了智能化的人才管理服务。而北京方寸无忧科技开发的无忧智慧公文解决方案,则利用AI技术实现了公文的自动化处理,大大提高了办公效率。36928资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-179644-0.html华为云Tokens服务接入384超节点,突破AI算力增长瓶颈

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 小米澎湃OS3大升级:加入超级岛功能,实现与苹果设备深度互联

下一篇: OPPO Find X6系列屏幕无可挑剔 将有望支持高2160Hz的PWM调光

标签:
  • 热门焦点
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 新电商三兄弟,“抖快红”成团!

    来源:价值研究所作 者:Hernanderz 随着内容电商的概念兴起,抖音、快手、小红书组成的“新电商三兄弟”成为业内一股不可忽视的势力,给阿里、京东、拼多多带去了巨大压
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • OPPO、vivo、小米等国内厂商Q2在印度智能手机市场份额依旧高达55%

    7月20日消息,据外媒报道,研究机构的报告显示,在全球智能手机出货量同比仍在下滑的大背景下,印度这一有潜力的市场也未能幸免,出货量同比也有下滑,多家厂
  • 华为Mate 60系列用上可变灵动岛:正式版体验将会更出色

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
Top