当前位置:首页 > 科技  > 手机

华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源

来源: 责编: 时间:2025-08-13 16:03:18 73观看
导读 快科技8月13日消息,据媒体报道,在2025金融AI推理应用落地与发展论坛上,华为重磅发布了其AI推理创新技术——UCM(推理记忆数据管理器)。这项技术被业内视为有望重塑国内AI推理格局的关键突破。UCM技术

快科技8月13日消息,据媒体报道,在2025金融AI推理应用落地与发展论坛上,华为重磅发布了其AI推理创新技术——UCM(推理记忆数据管理器)。这项技术被业内视为有望重塑国内AI推理格局的关键突破。bSj28资讯网——每日最新资讯28at.com

UCM技术的核心在于其先进的KV Cache系统,通过融合多种缓存加速算法工具与精细的分级管理策略,高效处理推理过程中产生的大量记忆数据。这带来了多重显著优势:有效扩大上下文窗口,确保推理过程的高吞吐量与低延迟,并显著降低每个Token的推理成本。bSj28资讯网——每日最新资讯28at.com

尤为关键的是,UCM技术有望缓解当前因HBM(高带宽内存)资源短缺导致的任务停滞与响应延迟问题,为AI应用提供更流畅的体验,从而减少行业对HBM的过度依赖。bSj28资讯网——每日最新资讯28at.com

此次论坛不仅是UCM技术的首次亮相,华为还宣布将携手中国银联,共同发布双方在AI推理领域的新应用成果。论坛还邀请了来自信通院、清华大学、科大讯飞等机构的专家,分享他们在优化大模型推理速度及提升用户体验方面的前沿经验。bSj28资讯网——每日最新资讯28at.com

华为数据存储产品线副总裁樊杰在演讲中强调了高质量行业数据与高性能存储对AI发展的重要性。他指出,未来的AI飞跃将极大依赖于此,高性能AI存储系统能将数据加载时间从数小时压缩至几分钟,同时使算力集群的效率实现倍增。bSj28资讯网——每日最新资讯28at.com

华为计划于2025年9月正式开源UCM技术,首发平台为魔擎社区。后续,华为将逐步将该技术贡献给业界主流的推理引擎社区,并向所有采用 “共享一切”(Share Everything) 架构的存储厂商及生态伙伴开放共享。bSj28资讯网——每日最新资讯28at.com

华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源bSj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-177043-0.html华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 杀入传音腹地!小米任命多位非洲市场高管 雷军称要加大投入

下一篇: 北京移动崩了 官方道歉

标签:
  • 热门焦点
  • 石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    科技圈经常能看到一个词叫“缝合怪”,用来形容那些把好多功能或者外观结合在一起的产品,通常这样的词是贬义词,但如果真的是产品缝合的好、缝合的实用的话,那它就成了中性词,今
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 六大权益!华为8月服务日开启:手机免费贴膜、维修免人工费

    8月5日消息,一年一度的华为开发者大会2023(Together)日前在松山湖拉开帷幕,与此同时,华为8月服务日也式开启,到店可享六大专属权益。华为用户可在华为商城Ap
  • 十个可以手动编写的 JavaScript 数组 API

    JavaScript 中有很多API,使用得当,会很方便,省力不少。 你知道它的原理吗? 今天这篇文章,我们将对它们进行一次小总结。现在开始吧。1.forEach()forEach()用于遍历数组接收一参
  • 如何通过Python线程池实现异步编程?

    线程池的概念和基本原理线程池是一种并发处理机制,它可以在程序启动时创建一组线程,并将它们置于等待任务的状态。当任务到达时,线程池中的某个线程会被唤醒并执行任务,执行完任
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 华为开发者大会2023日程公开:开设鸿蒙HarmonyOS 4体验区

    IT之家 7 月 31 日消息,华为今日公布了 HDC.Together 开发者大会 2023 的详细日程。整场大会将于 8 月 4 日-6 日之间举行,届时将发布最新一代鸿蒙 H
Top