当前位置:首页 > 科技  > 数码

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍

来源: 责编: 时间:2025-09-01 09:29:06 147观看
导读 快科技8月29日消息,NVIDIA日前发布了2季度财报,业绩依然暴涨,新一代AI显卡Blackwell系列中的强者GB300今年4季度也会正式上市,下下代的Rubin有6款产品正在推进。GB300的详细规格可以参考之前的文章,这里要来看一

快科技8月29日消息,NVIDIA日前发布了2季度财报,业绩依然暴涨,新一代AI显卡Blackwell系列中的强者GB300今年4季度也会正式上市,下下代的Rubin有6款产品正在推进。aLW28资讯网——每日最新资讯28at.com

GB300的详细规格可以参考之前的文章,这里要来看一个可能影响中美AI技术的变化,那就是在算法选择上,国产的AI跟NVIDIA已经有了分裂,前者选择的是UE8M0 FP8,而在Blackwell上NVIDIA强化的是NVFP4标准。aLW28资讯网——每日最新资讯28at.com

UE8M0 FP8这几天引爆了国产算力行业,这是Deepseek 3.1正式问世时DS官方公布的消息,称UE8M0 FP8已经全面适配即将发布的新一代国产AI芯片。aLW28资讯网——每日最新资讯28at.com

虽然没有特指哪家厂商,但是华为昇腾、摩尔线程、砺算科技、芯原科技、海光科技等厂商的新一代算力芯片几乎都会支持这个标准。aLW28资讯网——每日最新资讯28at.com

相比之前国产AI算力芯片主要采用FP16+INT8的算法标准,UE8M0 FP8带来的好处很多,性能是之前的2-3倍,并且大幅降低显存压力,还能降低功耗,具体就要看各大厂商的实现了。aLW28资讯网——每日最新资讯28at.com

那作为AI一哥的NVIDIA呢?相比国内AI领域率先有DS这种模型厂商来协同算法标准的情况,NVIDIA这几年一直以算力芯片上游厂商的身份来推动标准,FP64、FP32、FP16、INT8、FP8等标准都是支持的,而在Blackwell架构上,NVIDIA也支持FP4、MXFP4这两种标准,但重点推的是NVFP4,它跟E2M1 FP4结构差不多,但精度几乎没有多少损失。aLW28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aLW28资讯网——每日最新资讯28at.com

NVFP4标准的优点有哪些?首先来看性能上的,GB300的稠密性能大幅提升了50%而来到15PFlops,要知道它跟GB200基本架构可没什么变化。aLW28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aLW28资讯网——每日最新资讯28at.com

50%的性能提升或许不够惊人,那再来看看精度变化。aLW28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aLW28资讯网——每日最新资讯28at.com

与FP8的基准相比,NVFP4在DS 0528的模型精度上几乎持平,大部分落后不到1个百分点,AIME 2024中甚至还领先了2个百分点。aLW28资讯网——每日最新资讯28at.com

在内存使用上,NVFP4与FP16相比占用减少了3.5倍,相比FP8也减少了1.8倍,而GB300显卡HBM容量也从GB200的186GB提升到了288GB,同样的NVL72机柜中,系统的总内存容量可达40TB,能支持3000亿参数的大模型。aLW28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aLW28资讯网——每日最新资讯28at.com

第三个优势则是在能效上,GB300在NVFP4的支持下,每Token的能量消耗只有0.2J,GB200则是0.4J,H100架构的H100是10J,相比之下提升了50倍的能效。aLW28资讯网——每日最新资讯28at.com

简单来说,NVIDIA这次主导的NVFP4算法标准性能提升了50%,精度比FP8几乎没有损失,内存占用大幅减少2-3倍,能效则是50倍提升。aLW28资讯网——每日最新资讯28at.com

考虑到NVIDIA的影响力,NVFP4显然会成为前沿大模型广泛使用的算法标准,国内大厂应该也会大规模使用。aLW28资讯网——每日最新资讯28at.com

但在国产AI芯片上,UE8M0 FP8也已经成为新一代AI芯片的标准,尽管它还不能超越NVIDIA的CUDA生态,但是这显然也是国产AI软件及硬件领域的一次重大协同,同样有机会杀出重围,或许也能打造出自己的优势范围呢,一切都有可能。aLW28资讯网——每日最新资讯28at.com

与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍aLW28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-179551-0.html与国产AI分裂 NVIDIA强AI显卡GB300强化FP4:能效暴增50倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 2nm工艺淘汰国产设备 台积电两头下注:国内工厂不一样

下一篇: NVIDIA淘汰经典控制面板!几乎所有功能转向App

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    8月2日消息,今日小米科技创始人雷军在其微博上发布消息称,小米公益基金会宣布捐赠2500万元驰援北京、河北暴雨救灾。携手抗灾,京冀安康!以下为公告原文
  • 上海举办人工智能大会活动,建设人工智能新高地

    人工智能大会在上海浦江两岸隆重拉开帷幕,人工智能新技术、新产品、新应用、新理念集中亮相。8月30日晚,作为大会的特色活动之一的上海人工智能发展盛典人工
  • 三翼鸟智能家居亮相电博会,让用户体验更真实

    2021电博会在青岛国际会展中心开幕中,三翼鸟直接把“家”搬到了现场,成为了展会的一大看点。这也是三翼鸟继9月9日发布了行业首个一站式定制智慧家平台后的
Top