当前位置:首页 > 科技  > 数码

华为云Tokens服务接入384超节点,全栈创新引领AI算力新飞跃

来源: 责编: 时间:2025-08-29 08:49:42 87观看
导读在第四届828 B2B企业节盛大启幕之际,华为云传来了一则振奋人心的消息:其Tokens服务已成功接入CloudMatrix384超节点,标志着华为云在AI算力领域迈出了重要一步。借助xDeepServe架构的创新突破,华为云的单芯片性能实现了飞

在第四届828 B2B企业节盛大启幕之际,华为云传来了一则振奋人心的消息:其Tokens服务已成功接入CloudMatrix384超节点,标志着华为云在AI算力领域迈出了重要一步。3fo28资讯网——每日最新资讯28at.com

借助xDeepServe架构的创新突破,华为云的单芯片性能实现了飞跃,达到了2400TPS的超高吞吐量和50ms的超低时延,这一表现远远超越了当前业界的平均水平。这一技术革新,无疑为AI应用的高效运行提供了强有力的支持。3fo28资讯网——每日最新资讯28at.com

近年来,中国AI算力需求呈现出爆炸式增长。据统计,从2024年初到今年6月底,中国日均Token消耗量从1000亿激增到30万亿,短短一年半时间增长了300余倍。这一数据不仅反映了我国人工智能应用规模的迅速扩张,也对算力基础设施提出了前所未有的挑战。3fo28资讯网——每日最新资讯28at.com

面对这一挑战,华为云于今年3月正式推出了基于MaaS的Tokens服务。该服务不仅提供了在线版、进线版、离线版及尊享版等多种规格,以满足不同应用和场景的性能需求,还通过灵活的计费方式,为用户带来了更为便捷、低成本的算力解决方案。3fo28资讯网——每日最新资讯28at.com

此次Tokens服务接入CloudMatrix384超节点,更是将性能推向了新的高度。借助384原生的xDeepServe框架,吞吐量从年初的1920TPS跃升至2400TPS,TPOT也降低至50ms。这一提升,无疑为AI工具的高效运行提供了更为坚实的算力保障。3fo28资讯网——每日最新资讯28at.com

3fo28资讯网——每日最新资讯28at.com

华为云的这一成就,并非单点突破,而是从硬件到软件、从算子到存储、从推理框架到超节点的全方位创新。CloudMatrix384超节点以其全新的计算架构,突破了性能瓶颈,构筑了强大的算力基础。同时,CANN昇腾硬件使能、EMS弹性内存存储以及xDeepServe分布式推理框架等技术的协同作用,共同推动了算力的极致释放。3fo28资讯网——每日最新资讯28at.com

作为CloudMatrix384超节点的原生服务,xDeepServe采用了Transformerless的极致分离架构,将MoE大模型拆分为可独立伸缩的微模块,实现了高效的算力分配和利用。通过这一架构,CloudMatrix384上的大模型被拆解成“积木”,并分配到不同的NPU上同步处理任务,从而构建了一条超高吞吐的LLM服务平台,即Tokens的“超高速流水线”。3fo28资讯网——每日最新资讯28at.com

CANN作为硬件加速计算的中间层,包含了多个算子库和高性能通信库等组件,为AI模型的高效运行提供了有力支撑。其中,专为超节点上的大语言模型(LLM)服务打造的高性能通信库XCCL,充分发挥了CloudMatrix384扩展后的UB互联架构的潜力,为Transformerless的全面分离奠定了坚实的硬件基础。3fo28资讯网——每日最新资讯28at.com

而FlowServe作为被重构的“去中心”式分布式引擎,则将CloudMatrix384切割成完全自治的DP小组,每个小组都具备Tokenizer、执行器、RTC缓存与网络栈等完整功能,实现了千卡并发也不拥堵的高效运行。3fo28资讯网——每日最新资讯28at.com

目前,华为云MaaS服务已广泛支持DeepSeek、Kimi、Qwen等主流大模型及versatile、Dify等主流Agent平台。通过大量的模型性能优化和效果调优,华为云实现了“源于开源,高于开源”的目标,让更多大模型能够在昇腾云上实现更快更好的运行。3fo28资讯网——每日最新资讯28at.com

以文生图大模型为例,在轻微损失画质的前提下,通过Int8量化、旋转位置编码融合算子等方式,华为云MaaS平台实现了出图速度的两倍提升,最大尺寸支持达到2K×2K。而在文生视频大模型上,通过量化提速和通算并行等方式,视频生成速度大幅提升,相较于友商实现了3.5倍的性能提升。3fo28资讯网——每日最新资讯28at.com

在应用层面,华为云已与超过100家合作伙伴携手深入行业场景,共同推出了丰富的Agent解决方案。这些方案在调研分析、内容创作、智慧办公、智能运维等领域发挥了重要作用,帮助企业更便捷地拥抱AI创新,加速智能化转型。3fo28资讯网——每日最新资讯28at.com

例如,基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能够智能交互并处理任务,显著提升服务效率与客户满意度。而北京方寸无忧科技开发的无忧智慧公文解决方案,则通过智能化手段提升了公文处理效能,推动了政企办公的智能化转型。3fo28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-179357-0.html华为云Tokens服务接入384超节点,全栈创新引领AI算力新飞跃

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 15000mAh超大电池手机问世,续航力惊人可达50小时视频播放

下一篇: 百度沈抖:一个企业可以只有一个官网,但一定会有大量的Agents

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月份有一个618,虽然这是京东周年庆的日子,但别的电商也都不约而同的跟进了,反正促销没坏处,厂商和用户都能满意。618期间一些产品也出现了历史低价,那么各个价位段的产品性价比
  • 服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • 分享六款相见恨晚的PPT模版网站, 祝你做出精美的PPT!

    1、OfficePLUSOfficePLUS网站旨在为全球Office用户提供丰富的高品质原创PPT模板、实用文档、数据图表及个性化定制服务。优点:OfficePLUS是微软官方网站,囊括PPT模板、Word模
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 苹果、三星、惠普等暂停向印度出口笔记本和平板电脑

    集微网消息,据彭博社报道,在8月3日印度突然禁止在没有许可证的情况下向印度进口电脑/平板及显示器等产品后,苹果、三星电子和惠普等大公司暂停向印度
  • iQOO Neo8系列新品发布会

    旗舰双芯 更强更Pro
Top