当前位置:首页 > 科技  > 数码

国产显卡动作神速!摩尔线程全面支持DeepSeek开源周成果

来源: 责编: 时间:2025-03-03 11:54:59 175观看
导读 快科技3月2日消息,日前摩尔线程宣布,随着DeepSeek开源周收官,摩尔线程在短时间内,成功实现对DeepSeek各个开源项目的全面支持,涵盖FlashMLA、DeepEP、DeepGEMM、DualPipe 以及 Fire-Flyer文件系统(3FS)。摩尔线程

快科技3月2日消息,日前摩尔线程宣布,随着DeepSeek开源周收官,摩尔线程在短时间内,成功实现对DeepSeek各个开源项目的全面支持,涵盖FlashMLA、DeepEP、DeepGEMM、DualPipe 以及 Fire-Flyer文件系统(3FS)。fdv28资讯网——每日最新资讯28at.com

摩尔线程表示,这一成果充分验证了MUSA架构和全功能GPU在生态兼容与快速适配方面的强大优势。fdv28资讯网——每日最新资讯28at.com

以下是摩尔线程支持DeepSeek开源周“全家桶”代码合集:fdv28资讯网——每日最新资讯28at.com

FlashMLA:fdv28资讯网——每日最新资讯28at.com

FlashMLA是一款高效的MLA(Multi-Head Latent Attention)推理内核开源仓库,旨在加速MLA机制的计算,特别适用于DeepSeek系列模型(如DeepSeek-V2、V3和R1)。fdv28资讯网——每日最新资讯28at.com

摩尔线程基于全新MUSA Compute Capability 3.1计算架构,可提供原生FP8计算能力,同时升级了高性能线性代数模板库MUTLASS,快速支持了FlashMLA。fdv28资讯网——每日最新资讯28at.com

借助MUTLASS 0.2.0,摩尔线程发布开源仓库MT-FlashMLA,能够快速对DeepSeek FlashMLA进行兼容部署。fdv28资讯网——每日最新资讯28at.com

MT-FlashMLA开源地址:fdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/MT-flashMLAfdv28资讯网——每日最新资讯28at.com

MUTLASS FlashAttention3地址:fdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/mutlass/tree/main/experimental/mp31_flash_attention_fwdfdv28资讯网——每日最新资讯28at.com

DeepEP:fdv28资讯网——每日最新资讯28at.com

DeepEP是一个用于MoE(混合专家)模型训练和推理的开源EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要EP的集群训练。fdv28资讯网——每日最新资讯28at.com

它通过优化通信信道的使用率,显著提升了训练效率。摩尔线程基于MUSA Compute Capability 3.1全功能GPU,第一时间适配了DeepEP。fdv28资讯网——每日最新资讯28at.com

MT-DeepEP开源地址:fdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/MT-DeepEPfdv28资讯网——每日最新资讯28at.com

DeepGEMM:fdv28资讯网——每日最新资讯28at.com

DeepGEMM是一个支持密集矩阵与混合专家(MoE)矩阵乘法的FP8 GEMM库,为V3/R1的训练与推理提供强大动力。fdv28资讯网——每日最新资讯28at.com

这个开源仓库基于高性能通用矩阵乘法(GEMM)的C++模板库进行开发,摩尔线程基于MUTLASS在全新GPU架构上优化实现了FP8矩阵乘法,支持DeepGEMM的相应功能。fdv28资讯网——每日最新资讯28at.com

MUTLASS FP8 GEMM地址:fdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/mutlass/tree/main/examples/02_mp31_fp8_gemm_with_collective_builderfdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/mutlass/tree/main/examples/03_mp31_fp8_scaling_gemmfdv28资讯网——每日最新资讯28at.com

DualPipe:fdv28资讯网——每日最新资讯28at.com

DualPipe是DeepSeek-V3提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,显著减少了“流水线气泡”(设备空闲等待)。fdv28资讯网——每日最新资讯28at.com

与传统流水线并行相比,DualPipe 采用双向数据流设计,使数据从两端相向处理,大幅提升了资源利用率与训练效率。 fdv28资讯网——每日最新资讯28at.com

摩尔线程依托深度学习框架Torch-MUSA(已开源)和MUSA软件栈全方位的兼容性,实现了对DualPipe这一算法的高效支持。fdv28资讯网——每日最新资讯28at.com

MT-DualPipe可以完整接入摩尔线程 MT-Megatron框架和MT-TransformerEngine框架(即将开源),实现DeepSeek V3训练流程的完整复现。fdv28资讯网——每日最新资讯28at.com

MT-DualPipe开源地址:fdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/MT-DualPipefdv28资讯网——每日最新资讯28at.com

Torch-MUSA开源地址:fdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/Torch_MUSAfdv28资讯网——每日最新资讯28at.com

3FS:fdv28资讯网——每日最新资讯28at.com

Fire-Flyer文件系统(3FS)是一种利用现代SSD和RDMA网络的全部带宽的并行文件系统,可以把固态硬盘的带宽性能利用到极致。fdv28资讯网——每日最新资讯28at.com

摩尔线程在一天内完成了高性能分布式文件系统3FS的搭建,并高效开发了存储插件,成功实现与夸娥智算集群的无缝集成,为AI训练、AI推理、科学计算等场景提供全栈存储加速方案。fdv28资讯网——每日最新资讯28at.com

3FS CSI Driver地址:fdv28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/csi-driver-3fsfdv28资讯网——每日最新资讯28at.com

国产显卡动作神速!摩尔线程全面支持DeepSeek开源周成果fdv28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-135203-0.html国产显卡动作神速!摩尔线程全面支持DeepSeek开源周成果

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 《巫师4》希里脸部造型变动引热议,导演澄清:未修改,系开发常态

下一篇: 安徽师大团队首探中等质量黑洞“心跳”:恒星吞噬见证宇宙奇观

标签:
  • 热门焦点
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 每天一道面试题-CPU伪共享

    前言:了不起:又到了每天一到面试题的时候了!学弟,最近学习的怎么样啊 了不起学弟:最近学习的还不错,每天都在学习,每天都在进步! 了不起:那你最近学习的什么呢? 了不起学弟:最近在学习C
  • Temu起诉SHEIN,跨境电商战事升级

    来源 | 伯虎财经(bohuFN)作者 | 陈平安日前据外媒报道,拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼,诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
  • 小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    8月2日消息,今日小米科技创始人雷军在其微博上发布消息称,小米公益基金会宣布捐赠2500万元驰援北京、河北暴雨救灾。携手抗灾,京冀安康!以下为公告原文
  • 小米汽车电池信息疑似曝光:容量101kWh,支持800V高压快充

    7月14日消息,今日一名博主在社交媒体发布了一张疑似小米汽车电池信息的照片,显示该电池包正是宁德时代麒麟电池,容量为101kWh,电压为726.7V,可以预测小
  • 机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

    7月20日消息,据外媒报道,研究机构的报告显示,由于需求下滑,今年二季度全球智能手机的出货量,同比下滑了11%,三星、苹果等主要厂商的销量,较去年同期均有下
Top