当前位置:首页 > 科技  > 数码

真能替代NVIDIA? 我看这玩意够呛

来源: 责编: 时间:2025-02-17 07:07:19 199观看
导读 都说资本市场从来不缺故事讲,近 A 股大神们讲的故事那都绕不开 Deepseek ,各种小作文全方面吹了一波国产大模型的技术路线,想必各位也已经快听吐了。眼瞅着 Deepseek 的底裤都快被人扒下来了,我心想着这下总归

都说资本市场从来不缺故事讲,近 A 股大神们讲的故事那都绕不开 Deepseek ,各种小作文全方面吹了一波国产大模型的技术路线,想必各位也已经快听吐了。gfF28资讯网——每日最新资讯28at.com

眼瞅着 Deepseek 的底裤都快被人扒下来了,我心想着这下总归不会有新东西可以拿出来了罢,各家上市公司的股价也可以消停一波了。gfF28资讯网——每日最新资讯28at.com

结果这两天又在微博刷到几篇震惊体作文,说 “ Deepseek 已经是前菜啦, LPU 才是真正的氢弹级突破! ” gfF28资讯网——每日最新资讯28at.com

一听氢弹都来了,还是点进去看看吧。我也好奇,这号称能扼杀 NVIDIA 前程的 LPU 芯片到底是什么来头。gfF28资讯网——每日最新资讯28at.com

不过在连续看了几篇文章、读了几篇研报之后,我觉得这芯片真没股票专家们吹得那么美好。gfF28资讯网——每日最新资讯28at.com

首先给大家介绍一下 “ LPU ” 到底是个啥。gfF28资讯网——每日最新资讯28at.com

它并不是什么新东西,特指去年美国 Groq 公司发布的一款 AI 处理器,的中文名字叫做 “ 语言处理单元 ” ,给大语言模型做推理计算用的。gfF28资讯网——每日最新资讯28at.com

值得一提的是目前暂时没有任何国产的消息,说实话这概念就算用在炒 A 股上也是有点超前了。gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

它如今又被大家拿出来炒,还是因为有人研究了 Deepseek 的低成本方案,发现他们仅仅在 CUDA 驱动的 PTX 层做了一些优化,就实现了内存和通信效率的大幅提升。gfF28资讯网——每日最新资讯28at.com

那么如果再 “ 为算法单独设计硬件 ” ,效率的提升会更加可观。gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

于是大伙儿突然想开了,之前干 AI 就往上堆显卡的做法是自己把路走窄了。现有的硬件和软件都能再压榨压榨,能起到事半功倍的效果。gfF28资讯网——每日最新资讯28at.com

这软件 Deepseek 干了,硬件嘛,研究员们翻箱倒柜找出来的玩意就是 LPU 了。gfF28资讯网——每日最新资讯28at.com

作为针对大语言模型推理专门设计出的硬件,在发布之初,官方宣称它的推理速度是 NVIDIA GPU 的十倍,成本却仅有 NVIDIA 的十分之一。gfF28资讯网——每日最新资讯28at.com

它的高效率实现原理其实不复杂, LPU 把通用 GPU 里头的高带宽内存( HBM )换成了容量更低、但速度更快的静态随机内存( SRAM ),对于大语言模型这种需要频繁读取内存的计算来说,推理速度就会快不少。gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

给大家举个例子吧, HBM 就好比是原本的双向八车道,虽然很宽但什么车都能跑、红绿灯也多,反而很容易堵在一起;而 SRAM 就像是双向两车道、只能跑公交的快速路,虽然车道变少了,但通行效率却更高。gfF28资讯网——每日最新资讯28at.com

听起来有点意思是吧?gfF28资讯网——每日最新资讯28at.com

众所周知,这显卡是原本是给游戏佬们打游戏用的,误打误撞整了个 CUDA 之后被人发现很适合算 AI ,老黄也顺水推舟布局了一下通用 GPU 和 AI 运算,结果就造就了如今的万亿帝国;gfF28资讯网——每日最新资讯28at.com

这 LPU 听名字就是给大模型准备的,这岂不是比 NVIDIA 的起点还要高?gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

好了,说到这里我要开始泼冷水了:事实上当前 LPU 的局限性可能比你想象的要多,未来怎么样不好说,至少现在看来想替代通用 GPU 还差点意思。gfF28资讯网——每日最新资讯28at.com

为了解释这个问题,我们首先得讲一个看起来表面没什么关联的故事——关注币圈的老哥们可能都知道,有个东西叫做 ASIC 矿机。gfF28资讯网——每日最新资讯28at.com

这里所谓的 “ ASIC ” 是一种专为某种用途定制的芯片。用于挖矿的 ASIC 直接在硬件层面就实现了某种挖矿算法,这样一来挖矿的效率要比显卡高上不少,费用也要便宜一些。gfF28资讯网——每日最新资讯28at.com

你看,更低成本、更高效率、专用芯片,听起来跟 LPU 好像是一个路子呀?gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

但是直到后,显卡都没有被 “ 矿场 ” 淘汰,还是老黄自己出手自废武功,禁了 40 、 50 系显卡挖矿时的 HASH 算力。gfF28资讯网——每日最新资讯28at.com

这是为什么呢?因为 ASIC 矿机的计算效率确实是高,但代价就是 --- “ 专用 ” 。gfF28资讯网——每日最新资讯28at.com

前面说到了, ASIC 芯片在硬件设计层面就匹配了挖矿的算法,所以就导致挖比特币的 ASIC 矿机能且只能挖比特币、挖以太坊的能且只能挖以太坊。gfF28资讯网——每日最新资讯28at.com

矿主们要是想换个币挖挖,那得连机器一块换了才行。gfF28资讯网——每日最新资讯28at.com

这就有点抽象了哇:要是哪天比特币不值钱了,哥们囤的比特币矿机不就都成了矿渣了?gfF28资讯网——每日最新资讯28at.com

后来加密货币逐渐井喷,一天发一个新币种不难,但是一天设计一款新的 ASIC 挖矿芯片可就没那么容易了。gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

现在大伙应该明白了,显卡相比矿机看似毫无优势却能经久不衰,主要原因就在于显卡更 “ 通用 ” 。gfF28资讯网——每日最新资讯28at.com

即使 NVIDIA 40 系开始已经不再能挖矿了,矿场上还是有很多 30 系的显卡在发光发热。gfF28资讯网——每日最新资讯28at.com

而 LPU 这边儿也是差不多道理,正因为它是专用于大语言模型推理的芯片,所以要是让它处理个图片视频之类的就没有优势了。gfF28资讯网——每日最新资讯28at.com

可如今人们都想让 AI 干更多的事儿,除了能推理还需要它能识别物品、听懂语言,全靠 LPU 撑起 AI 算力的一片天显然不现实。gfF28资讯网——每日最新资讯28at.com

而且在 AI 训练这方面,内存较小的 SRAM 也难堪大用,还是得显卡出手。gfF28资讯网——每日最新资讯28at.com

而且, “ASIC 矿机 ” 能够引爆市场还有一个原因——不仅仅是比显卡高效那么简单,它是比显卡的效率高了一千多倍!比特币 ASIC 矿机发展到后,挖矿效率甚至比显卡高了上万倍!gfF28资讯网——每日最新资讯28at.com

但如今的 LPU 芯片远没有这么夸张的效率提升:Groq 官方说效率提升一百多倍,也有新闻说提升十几倍。但不论是哪个信源的结论,都比当年 ASIC 矿机的成绩差远了,谁能保证 LPU 会不会成为更不值钱的矿渣?gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

还有各家资本侃侃而谈的成本,其实去年的这个时候,我们的同行《 芯东西 》也写过 LPU 芯片的报道,其中引用了前阿里副总裁贾扬清做过的一个粗略的测算。gfF28资讯网——每日最新资讯28at.com

按照三年时间的运营成本来计算, Groq LPU 的采购成本会是 NVIDIA H100 的 38 倍,运营成本则达到了 10 倍。gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

看到这里, LPU 芯片目前是个什么水平相信大家也都比较清楚了。gfF28资讯网——每日最新资讯28at.com

我并不认为 LPU 是个没用的东西,毕竟当年 NPU 刚推出的时候,小伙伴们普遍也都不太看好——但是如今几乎只要是个消费级的处理器芯片,里面就会集成一个小型 NPU 。gfF28资讯网——每日最新资讯28at.com

但我觉得,如今吹 LPU 还是有点儿为时过早,尤其是各路 A 股大神借着 LPU 就开始 “ 荐股 ” ,搞得我也挺纳闷儿的,不知情的还以为 LPU 是中国公司造的。gfF28资讯网——每日最新资讯28at.com

这可真是有点儿不厚道了。gfF28资讯网——每日最新资讯28at.com

真能替代NVIDIA? 我看这玩意够呛gfF28资讯网——每日最新资讯28at.com

更何况,当下的 AI 行业还是有很多的不确定性—— Deepseek 的低成本模式会不会是昙花一现?现在的 AI 模型会不会被更高效的取代?下一代 GPU 会不会有划时代的技术突破?这些谁也说不准。gfF28资讯网——每日最新资讯28at.com

当然了,未来的不确定性也有可能是对 LPU 有利的。但现阶段咱还是别听 A 股大神们胡吹,他们要是能压准,早就不在这儿给你推荐 LPU 概念股了。gfF28资讯网——每日最新资讯28at.com


文章出处:差评

本文链接:http://www.28at.com/showinfo-24-130973-0.html真能替代NVIDIA? 我看这玩意够呛

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 酷睿Ultra 5 230F上手:小幅领先于前代 装机成本更低

下一篇: AMD Zen6升级单CCD 12核心!两个CCD终于可以直连

标签:
  • 热门焦点
  • 鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场,官方在发布会之前也已经正式给出了可升级的机型产品,这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
  • Redmi Pad评测:红米充满野心的一次尝试

    从Note系列到K系列,从蓝牙耳机到笔记本电脑,红米不知不觉之间也已经形成了自己颇有竞争力的产品体系,在中端和次旗舰市场上甚至要比小米新机的表现来得更好,正所谓“大丈夫生居
  • 小米平板5 Pro 12.4简评:多专多能 兼顾影音娱乐的大屏利器

    疫情带来了网课,网课盘活了安卓平板,安卓平板市场虽然中途停滞了几年,但好的一点就是停滞的这几年行业又有了新的发展方向,例如超窄边框、高刷新率、多摄镜头组合等,这就让安卓
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • AMD的AI芯片转单给三星可能性不大 与台积电已合作至2nm制程

    据 DIGITIMES 消息,英伟达 AI GPU 出货逐季飙升,接下来 AMD MI 300 系列将在第 4 季底量产。而半导体业内人士表示,近日传出 AMD 的 AI 芯片将转单给
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
Top