当前位置:首页 > 元宇宙 > AI

英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍

来源: 责编: 时间:2025-06-04 16:57:02 191观看
导读 6 月 3 日消息,科技媒体 marktechpost 昨日(6 月 2 日)发布博文,报道称英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。扩散模型被认为是传统自回

6 月 3 日消息,科技媒体 marktechpost 昨日(6 月 2 日)发布博文,报道称英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。Jzo28资讯网——每日最新资讯28at.com

扩散模型被认为是传统自回归模型(Autoregressive Models)的有力竞争者,采用双向注意力机制(Bidirectional Attention Mechanisms),理论上能通过同步生成多个词元(Multi-token Generation)加速解码过程。Jzo28资讯网——每日最新资讯28at.com

不过在实际应用中,扩散模型的推理速度往往无法媲美自回归模型,每次生成步骤都需要重复计算全部注意力状态,导致计算成本高昂。此外,多词元同步解码时,词元间的依赖关系易被破坏,生成质量下降,让其难以满足实际需求。Jzo28资讯网——每日最新资讯28at.com

援引博文介绍,英伟达组建的联合团队为解决上述瓶颈,研发了 Fast-dLLM 框架。该框架引入两大创新:块状近似 KV 缓存机制和置信度感知并行解码策略。Jzo28资讯网——每日最新资讯28at.com

Jzo28资讯网——每日最新资讯28at.com

KV 缓存通过将序列划分为块(Blocks),预计算并存储其他块的激活值(KV Activations),在后续解码中重复利用,显著减少计算冗余。其 DualCache 版本进一步缓存前后缀词元(Prefix and Suffix Tokens),利用相邻推理步骤的高相似性提升效率。Jzo28资讯网——每日最新资讯28at.com

而置信度解码则根据设定的阈值(Confidence Threshold),选择性解码高置信度的词元,避免同步采样带来的依赖冲突,确保生成质量。Jzo28资讯网——每日最新资讯28at.com

Fast-dLLM 在多项基准测试中展现了惊人表现。在 GSM8K 数据集上,生成长度为 1024 词元时,其 8-shot 配置下实现了 27.6 倍加速,准确率达 76.0%;在 MATH 基准测试中,加速倍数为 6.5 倍,准确率约为 39.3%;在 HumanEval 和 MBPP 测试中,分别实现了 3.2 倍和 7.8 倍加速,准确率维持在 54.3% 和基线水平附近。Jzo28资讯网——每日最新资讯28at.com

Jzo28资讯网——每日最新资讯28at.com

整体来看,Fast-dLLM 在加速的同时,准确率仅下降 1-2 个百分点,证明其有效平衡速度与质量。这项研究通过解决推理效率和解码质量问题,让扩散模型在实际语言生成任务中具备了与自回归模型竞争的实力,为未来广泛应用奠定了基础。Jzo28资讯网——每日最新资讯28at.com

Jzo28资讯网——每日最新资讯28at.com

附上参考地址Jzo28资讯网——每日最新资讯28at.com

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding论文Jzo28资讯网——每日最新资讯28at.com

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding项目界面Jzo28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13399-0.html英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 苹果A20芯片大升级!iPhone 18 Pro将首发2nm工艺,性能如何?

下一篇: 任天堂《塞尔达传说》手机伴侣应用被指使用生成式 AI 配音

标签:
  • 热门焦点
  • B端难做:留给魔珐科技的时间不多了

    来源:零态LT元宇宙泡沫正在碎裂,进入2023年后这一赛道热度一直在递减。今年2月,微软解散了成立仅四个月的工业元宇宙部门;今年3月,该公司2017年收购的虚拟现实社交平台AltspaceVR
  • 沉寂3年,大模型激活小度天猫精灵?

    Tech星球(微信ID:tech618)文 | 何煦阳 沉寂了许久的智能音箱,在今年大模型横空出世之后,又再次燃起了新的希望。 2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型&ldq
  • AIGC产品测评TOP25丨谁能抢到下个十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦阳策划 | 杨晓鹤封面来源 | 图虫创意 2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google 旗下 Dee
  • 关于年度热词NFT,除了钱,我们还可以聊点啥?

    每到年底,社交媒体总少不了年度盘点、年度总结、年度热词。如果让你来总结2021年度热词,你会想到什么?柯林斯词典将年度热词颁给了“NFT”,而其理由是:一个缩写词的
  • 2022年最具关注的9个头像NFT项目

    什么是 PFP NFT 项目?PFP NFT (个人资料图片NFT)是一组独特的数字收藏品,人们用来在互联网平台上代表自己。这些数字艺术作品通常是一系列可作为头像的角色,在 Twit
  • 元宇宙风归何处?

    元宇宙持续大火,在过去一段时间内,其屡次登上热点,吸引了一波又一波投资者。近期,在“2022中国·金鱼嘴元宇宙生态赋能大会”上,南京建邺区金鱼嘴基金街区宣布计划
  • 这个好莱坞影视制作公司涉足NFT,让持有者在制作中发挥作用

    前米高梅首席执行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一个新的好莱坞工作室,提供 NFT,让持有者在制作中发挥作用Electromagnetic Productions 创始
  • 音乐家如何利用NFTs来提高歌迷参与度

    "音乐是一种语言,不以特定的文字说话。它用情感说话,如果它在骨子里,它就在骨子里。" - Keith Richards音乐激励着我们,使我们流泪,使我们充满狂喜,并抚慰我们的灵魂
  • 大厂打造元宇宙平台的业务重心是什么?

    知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告,其中提出互联网大厂各自独立布局元宇宙平台。事实上,在2021年的最后一个季度,包括Meta、英伟达、
Top