当前位置:首页 > 科技  > 数码

NVIDIA要用上X3D堆叠设计!下代Feynman GPU将引入LPU

来源: 责编: 时间:2025-12-30 09:58:05 279观看
导读 快科技12月29日消息,虽然NVIDIA目前在AI训练领域无可匹敌,但面对日益增长的即时推理需求,其正筹划一项足以改变行业格局的“秘密武器”。据AGF透露,NVIDIA计划在2028年推出的Feynman(费曼)架构GPU中,整

快科技12月29日消息,虽然NVIDIA目前在AI训练领域无可匹敌,但面对日益增长的即时推理需求,其正筹划一项足以改变行业格局的“秘密武器”。jno28资讯网——每日最新资讯28at.com

据AGF透露,NVIDIA计划在2028年推出的Feynman(费曼)架构GPU中,整合来自Groq公司的LPU(语言处理单元),以大幅提升AI推理性能。jno28资讯网——每日最新资讯28at.com

Feynman架构将接替Rubin架构,采用台积电先进的A16(1.6nm)制程,为了突破半导体物理限制,NVIDIA计划利用台积电的SoIC混合键合技术,将专为推理加速设计的LPU单元直接堆叠在GPU之上。jno28资讯网——每日最新资讯28at.com

NVIDIA要用上X3D堆叠设计!下代Feynman GPU将引入LPUjno28资讯网——每日最新资讯28at.com

这种设计类似于AMD的3D V-Cache技术,但NVIDIA堆叠的不是普通缓存,而是专为推理加速设计的LPU单元。jno28资讯网——每日最新资讯28at.com

设计的核心逻辑在于解决SRAM的微缩困境,在1.6nm这种极致工艺下,直接在主芯片集成大量SRAM成本极高且占用空间。jno28资讯网——每日最新资讯28at.com

通过堆叠技术,NVIDIA可以将运算核心留在主芯片,而将需要大量面积的SRAM独立成另一层芯片堆叠上去。jno28资讯网——每日最新资讯28at.com

台积电的A16制程一大特色是支持背面供电技术,这项技术可以腾出芯片正面的空间,专供垂直信号连接,确保堆叠的LPU能以极低功耗进行高速数据交换。jno28资讯网——每日最新资讯28at.com

结合LPU的“确定性”执行逻辑,未来的NVIDIA GPU在处理即时AI响应(如语音对话、实时翻译)时,速度将实现质的飞跃。jno28资讯网——每日最新资讯28at.com

不过这也存在两大潜在挑战,分别是散热问题和CUDA兼容性难题,在运算密度极高的GPU 再加盖一层芯片,如何避免“热当机”是工程团队的头号难题。jno28资讯网——每日最新资讯28at.com

同时LPU强调“确定性”执行顺序,需要精确的内存配置,而CUDA生态则是基于硬件抽象化设计的,要让这两者完美协同,需要顶级的软件优化。jno28资讯网——每日最新资讯28at.com

NVIDIA要用上X3D堆叠设计!下代Feynman GPU将引入LPUjno28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-190765-0.htmlNVIDIA要用上X3D堆叠设计!下代Feynman GPU将引入LPU

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 万联易达获“国家高新技术企业”认定 创新驱动产业互联网生态发展

下一篇: 国产自研6nm GPU投入使用!砺算科技7G100完成首批订单交付

标签:
  • 热门焦点
Top