当前位置:首页 > 元宇宙 > AI

华为云Tokens服务接入384超节点,算力突破至2400TPS引领AI创新

来源: 责编: 时间:2025-09-03 16:52:50 117观看
导读在第四届828 B2B企业节盛大开幕之际,华为云宣布了一项重大技术进展:其Tokens服务已成功融入CloudMatrix384超节点,借助创新的xDeepServe架构,实现了单芯片2400TPS的超高吞吐量和50ms的极低时延,这一性能表现远超当前业界标

在第四届828 B2B企业节盛大开幕之际,华为云宣布了一项重大技术进展:其Tokens服务已成功融入CloudMatrix384超节点,借助创新的xDeepServe架构,实现了单芯片2400TPS的超高吞吐量和50ms的极低时延,这一性能表现远超当前业界标准。GxX28资讯网——每日最新资讯28at.com

面对中国AI算力需求的急剧增长,华为云积极应对挑战,推出了基于MaaS的Tokens服务。从最初按卡时计费的模式,到如今提供包括在线版、进线版、离线版及尊享版在内的多样化服务规格,这一转变不仅满足了不同应用和场景的性能需求,更为AI工具如大模型和Agent智能体等提供了更为灵活、高效且成本友好的算力支持。GxX28资讯网——每日最新资讯28at.com

此次Tokens服务与CloudMatrix384超节点的结合,是华为云算力构建策略的重要里程碑。通过384原生的xDeepServe框架,服务吞吐量实现了从年初的1920TPS到2400TPS的显著提升,同时保持了极低的时延。这一成就得益于华为在硬件、软件、算子、存储、推理框架及超节点等各个层面的全栈创新能力。GxX28资讯网——每日最新资讯28at.com

GxX28资讯网——每日最新资讯28at.com

CloudMatrix384超节点以其革新的计算架构,打破了性能瓶颈,为澎湃算力奠定了坚实基础。而CANN昇腾硬件使能则通过优化算子和高效通信策略,确保云端算力得以最高效地调用和组合。EMS弹性内存存储技术更是突破了AI内存墙,实现了“以存强算”,让每颗芯片的算力得到彻底释放。xDeepServe分布式推理框架则以其Transformerless的极致分离架构,进一步提升了超节点的算力效率。GxX28资讯网——每日最新资讯28at.com

xDeepServe通过将MoE大模型拆分为可独立伸缩的Attention、FFN、Expert微模块,实现了在CloudMatrix384上的高效并行处理。这些微模块被分配到不同的NPU上同步执行任务,并通过基于内存语义的微秒级XCCL通信库与FlowServe自研推理引擎重新组合,形成了一条超高吞吐量的LLM服务平台,即Tokens的“超高速流水线”。GxX28资讯网——每日最新资讯28at.com

作为专为超节点上的大语言模型服务设计的高性能通信库,XCCL充分发挥了CloudMatrix384扩展后的UB互联架构潜力,为Transformerless的全面分离提供了坚实的带宽与时延基础。而FlowServe作为被重构的“去中心”式分布式引擎,则将CloudMatrix384划分为完全自治的DP小组,每个小组都能自给自足,确保了即使千卡并发也不会出现拥堵现象。GxX28资讯网——每日最新资讯28at.com

华为云MaaS服务目前已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify等主流Agent平台。通过积累的大量模型性能优化和效果调优技术,华为云实现了“源于开源,高于开源”,让更多大模型在昇腾云上展现出更快的运行速度和更好的性能表现。以文生图大模型为例,在轻微损失画质的情况下,通过Int8量化和旋转位置编码融合算子等方式,华为云MaaS平台实现了出图速度的两倍提升,最大尺寸支持达到2K×2K。而在文生视频大模型上,通过量化提速和通算并行等方式,视频生成速度相较于友商实现了3.5倍的性能提升。GxX28资讯网——每日最新资讯28at.com

在应用层面,华为云已与超过100家合作伙伴携手,深入行业场景,共同构建了丰富的Agent,广泛应用于调研分析、内容创作、智慧办公、智能运维等领域,解决了众多产业难题。例如,基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能够智能交互并处理任务,显著提升了服务效率与客户满意度。而北京方寸无忧科技开发的无忧智慧公文解决方案,则有效提升了公文处理效能,推动了政企办公的智能化转型。GxX28资讯网——每日最新资讯28at.com

随着以Token为动力的智能社会的到来,华为云凭借其系统级创新能力和全新的Tokens服务,正构筑起先进算力,助力各行各业加速落地AI,推动智能化进程。GxX28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0    更多>同类资讯超六成iPhone用户意向购买iPhone 17系列,电池续航成升级主因快科技9月2日消息,智能手机比价平台SellCell发布iPhone用户调查:超六成计划购入iPhone 17,电池续航成首要升级因素。据悉,SellCell 8月份针对2000余名美国iPhone用户展开…09-038月A股定增市场升温,TCL科技、*ST松发领衔募资榜以首次披露预案公告日统计,2025年8月A股上市公司披露的定增预案(同一定增预案下的募资及配套募资合并统计,下同)共计44起,拟募资规模合计约352.78亿元,同比上升112%、环比上升24%。 从单家公司…09-02北大计算机学院&中国电信云研究院联袂招生:计算机视觉方向联培博士计算机学院同国内外多所大学、研究机构建立密切的学术联系和学生交换项目,如美国麻省理工学院(MIT)、卡耐基梅隆大学(CMU)、康奈尔大学(Cornell)、加州大学洛杉矶分校(UCLA),英国爱丁堡大学,日…09-02LayerX:日本AI新星获1亿美元融资,引领企业后台自动化革命09-02Prime Intellect发布“环境中心”平台,旨在打破AI强化学习封闭生态09-02DeepSeek标识AI生成内容,提升用户认知与信息安全09-02新加坡初创公司推出层次推理模型HRM,实现AI推理速度百倍提升09-02Meta超级智能实验室动荡:内讧、人才风波挑战超级智能梦09-02苏宁易购引领国产AI突破:灵思大模型携手寒武纪,成本大降效率飙升09-02OpenAI拟在印度建大型数据中心,加速亚洲AI基础设施布局09-02Salesforce采用AI代理系统,精简4000人力,加速业务效率提升09-02马斯克xAI公司起诉前工程师,涉嫌窃密跳槽至竞争对手OpenAI09-02台积电二季度晶圆代工市场份额再创新高,占比超七成09-02超六成iPhone用户欲换iPhone 17,电池续航成换机最大诱因09-02华为若上市,市值能否超越数十个寒武纪?最近,一些板块涨疯了,市值动辄数百倍,有的上千倍,一些营收不多、常年亏损的公司,股价高达数百亿,一两年时间股价涨了数倍,甚至涨了上十倍。 但上市公司就不同了,在研发投入尤其是基础研发投入方面,决策可能会受股东…09-02点击查看更多 +全站最新本田CB500SF或将亮相摩博会,复古街车新风采引期待本田CB500SF或将亮相摩博会,复古街车新风采引期待蔚来李斌透露新车规划:四季度冲刺月销5万,加速产能提升蔚来李斌透露新车规划:四季度冲刺月销5万,加速产能提升宝马发布全新电动踏板概念车Vision CE“梦幻CE”,配备防护架引关注宝马发布全新电动踏板概念车Vision CE“梦幻CE”,配备防护架引关注福特Mustang GT500即将重启,伪装原型车动力强劲引期待福特Mustang GT500即将重启,伪装原型车动力强劲引期待方程豹钛7将于9月9日上市,预计起价低于25万,高配配智能无人机方程豹钛7将于9月9日上市,预计起价低于25万,高配配智能无人机腾势汽车8月销量破万,D9至尊版领衔成都车展,加速全球豪华市场布局腾势汽车8月销量破万,D9至尊版领衔成都车展,加速全球豪华市场布局热门内容
  • 苹果加速AI布局,或收购两家法国AI初创企业
  • DeepSeek V3.1大模型升级,适配国产新芯片,性能显著提升
  • 苹果AI布局加速,或将斥巨资收购欧洲两大AI初创企业
  • 红米Note15系列前瞻:7s芯片、7000mAh大电池,防水新标杆即将登场
  • 科创板AI基金8月22日净值飙升7.79%,重仓股表现抢眼
  • vivo X300系列新机入网:首发LYT-828+2亿像素,卫通版支持北斗卫星短信
  • 华为智能手表登顶全球,苹果需直面挑战求变革
  • 可可西里迎来科技新成员:“机器藏羚羊”助力零干扰科研观测
  • 科创AIETF资金净流入破15亿,GPT-5发布助推AI市场热议
  • OpenAI冲刺5000亿估值,GPT-5遇冷:资本狂欢与技术瓶颈的碰撞
  • 华为云重组风暴:多部门整合,聚焦AI领域引发关注
  • 高德地图2025:开启AI出行新时代,打造全球首个地图AI原生智能体
  • AI冲击职场:美国毕业生失业率飙升,科技行业首当其冲
  • 科大讯飞股价上扬1.51%,机构聚焦AI应用落地,讯飞成投资热点
  • 华为银联联手,8月12日揭秘AI推理加速新技术,助力AI生态升级
本栏最新超六成iPhone用户意向购买iPhone 17系列,电池续航成升级主因超六成iPhone用户意向购买iPhone 17系列,电池续航成升级主因8月A股定增市场升温,TCL科技、*ST松发领衔募资榜8月A股定增市场升温,TCL科技、*ST松发领衔募资榜北大计算机学院&中国电信云研究院联袂招生:计算机视觉方向联培博士北大计算机学院&中国电信云研究院联袂招生:计算机视觉方向联培博士华为若上市,市值能否超越数十个寒武纪?华为若上市,市值能否超越数十个寒武纪?智慧家庭新时代:网络万兆升级,AI交互革新,服务机器人引领终端变革智慧家庭新时代:网络万兆升级,AI交互革新,服务机器人引领终端变革谷歌Pixel 10内存新设计:AI专用内存引发用户关注谷歌Pixel 10内存新设计:AI专用内存引发用户关注

本文链接:http://www.28at.com/showinfo-45-27247-0.html华为云Tokens服务接入384超节点,算力突破至2400TPS引领AI创新

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: SSD价格飙升,SAS与SATA硬盘价差持续扩大

下一篇: 超六成iPhone用户意向购买iPhone 17系列,电池续航成升级主因

标签:
  • 热门焦点
  • 元宇宙的文旅赛道,还能如何发力?

    来源:X增强现实苹果推出Vision Pro,为XR行业注入一剂强心针。而在苹果开发者大会上迪士尼CEO鲍勃·艾格在宣布迪士尼与苹果达成合作,其Disney+流媒体服务将于Vision Pro
  • AI大模型“战火”烧到了教育领域

    作者:刘旷自2023年开年以来,AI大模型这股风是越吹越猛烈了。随着ChatGPT的出圈爆火,再度掀起了一波AI热浪,无论是在国内还是国外都有不少企业宣布入局或者跟进AI大模型领域。与
  • 元宇宙里掀起回忆杀?这波虚拟怀旧营销主打一个极限反差

    来源:首席品牌官从被称为“元宇宙元年”的2021年开始,几乎所有品牌都在迫不及待地“入驻”元宇宙。而一提及品牌们的元宇宙玩法,相信多数人脑海里首先浮现
  • 智能人机交互技术的春晚大考

    1月初的一个早晨,京东智能客户服务产品部紧急开会,进行关于尚未对外公布的“X项目”的初讨论。1月5日,这个神秘的X项目对外公布,京东成为央视2022年春晚独家互动合
  • 重温 1602 年:DAO 是新的企业范式吗?

    作者:Andrew Singer“ 将你的选票委托给行业有能力的专家,将使所有者在这些公司的管理中拥有更强大、更清晰的话语权 。”1602 年,荷兰东印度公司成立,许多人认为
  • 小众有趣NFT艺术作品欣赏(1)

    随着NFT发展火热,越来越多领域与NFT融合,NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处,也有完全不同的地方。NFT艺术与传统艺术一样,表现了
  • 与元宇宙美少女艺术家的对话

    我最近宣布了我自己的NFT项目,这是我已经工作了几个月的事情。由于我之前只是一个收藏家,拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
  • 量子计算在未来能否提高区块链技术的效率

    区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
  • 元宇宙画廊体验报告:有点头疼。

    2 月 10 日,Hrishi Rajasekar 在旧金山铸币厂的沉浸式 NFT 展览 Verse 观看增强现实艺术品。“我们现在在虚拟世界中吗?时间好像变长了” 我问身后排队的人。我
Top