当前位置:首页 > 科技  > 芯片

DeepSeek开源周再放大招

来源: 责编: 时间:2025-02-27 08:20:12 123观看
导读近日,DeepSeek开源周活动如火如荼地进行中,继MLA解码核FlashMLA以及DeepEP两款代码库开源后,DeepSeek再次抛出重磅炸弹——宣布开放DeepGEMM代码库。DeepGEMM,这款专为简洁高效的FP8通用矩阵乘法(GEMMs)而设计的代码库,无疑

近日,DeepSeek开源周活动如火如荼地进行中,继MLA解码核FlashMLA以及DeepEP两款代码库开源后,DeepSeek再次抛出重磅炸弹——宣布开放DeepGEMM代码库。B1O28资讯网——每日最新资讯28at.com


B1O28资讯网——每日最新资讯28at.com

DeepGEMM,这款专为简洁高效的FP8通用矩阵乘法(GEMMs)而设计的代码库,无疑是此次开源周的又一大亮点。它不仅支持普通的GEMM运算,还兼顾了专家混合(MoE)分组的运算需求,展现了其强大的通用性和灵活性。B1O28资讯网——每日最新资讯28at.com


B1O28资讯网——每日最新资讯28at.com



B1O28资讯网——每日最新资讯28at.com

值得一提的是,该代码库使用CUDA编写,安装过程无需繁琐的编译步骤,只需在运行时通过轻量级即时编译模块即可完成所有内核的编译,极大地提升了开发效率。B1O28资讯网——每日最新资讯28at.com


B1O28资讯网——每日最新资讯28at.com

DeepGEMM的代码量仅约为300行,却巧妙地解决了FP8张量核心累加不精确的问题。它采用了CUDA核心的两级累加(提升)方法,确保了运算的准确性和稳定性。目前,该代码库仅支持英伟达Hopper架构运算,但这一限制并未影响其成为FP8通用矩阵乘法领域的佼佼者。B1O28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-27-134139-0.htmlDeepSeek开源周再放大招

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微崇半导体完成A+轮融资,加速晶圆检测技术创新

下一篇: 深圳市集成电路产量2024年占全国14.8%

标签:
  • 热门焦点
Top