当前位置:首页 > 元宇宙 > AI

摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

来源: 责编: 时间:2025-03-02 09:07:16 147观看
导读 2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。据介绍,DeepEP 是一个用于 MoE(混合专家)模

2 月 27 日消息,在 DeepSeek 开源周第四日,摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe,并发布相关开源代码仓库:MT-DeepEP 和 MT-DualPipe。1oS28资讯网——每日最新资讯28at.com

1oS28资讯网——每日最新资讯28at.com

据介绍,DeepEP 是一个用于 MoE(混合专家)模型训练和推理的开源 EP(expert parallelism,专家并行)通信库,主要适用于大模型训练,特别是需要 EP 的集群训练。它通过优化通信信道的使用率,提升了训练效率。摩尔线程基于 MUSA Compute Capability 3.1 全功能 GPU 适配了 DeepEP,并支持以下特性:1oS28资讯网——每日最新资讯28at.com

高效优化的 All-to-All 通信,支持 dispatch & combine1oS28资讯网——每日最新资讯28at.com

支持 MTLink + GPU(MUSA Compute Capability 3.1)节点内通信1oS28资讯网——每日最新资讯28at.com

训练及推理预填充阶段的高吞吐量计算核心1oS28资讯网——每日最新资讯28at.com

推理解码阶段的低延迟计算核心1oS28资讯网——每日最新资讯28at.com

原生支持 FP8 数据分发1oS28资讯网——每日最新资讯28at.com

灵活控制 GPU 资源,实现计算与通信的高效重叠1oS28资讯网——每日最新资讯28at.com

DualPipe 是 DeepSeek-V3 提出的双向流水线并行算法,通过前向计算与后向计算阶段的计算与通信完全重叠,减少了“流水线气泡”(设备空闲等待)。摩尔线程依托深度学习框架 Torch-MUSA(已开源)和 MUSA 软件栈全方位的兼容性,实现了对 DualPipe 这一算法的支持。1oS28资讯网——每日最新资讯28at.com

目前,MT-DualPipe 可以完整接入摩尔线程 MT-Megatron 框架和 MT-TransformerEngine 框架(即将开源),实现 DeepSeek V3 训练流程完整复现。此外,MT-DualPipe 结合 MT-Megatron 可实现完整 DeepSeek V3 模型 MLP-FFN 分离以及 DW-DG 分离,进一步降低气泡占比,优化通信效率。同时,MT-DualPipe 与 MT-TranformerEngine 和 MT-DeepEP 的结合,可利用 MT-DeepEP 和异步通信引擎实现更高效的通信掩盖,降低对计算资源损耗。1oS28资讯网——每日最新资讯28at.com

附 Torch-MUSA 开源地址如下:1oS28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/Torch_MUSA1oS28资讯网——每日最新资讯28at.com

相关阅读:1oS28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 4/5:DualPipe、EPLB 优化并行策略》1oS28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 3/5:深度学习利器 DeepGEMM》1oS28资讯网——每日最新资讯28at.com

《DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP》1oS28资讯网——每日最新资讯28at.com

《DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA》1oS28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11260-0.html摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 腾讯混元新一代快思考模型 Turbo S 发布,支持“秒回”

下一篇: 地道表达 + 文化解读:谷歌翻译酝酿“追问”功能,打造你的专属 AI 外教

标签:
  • 热门焦点
  • 雷克萨斯高管,“受贿”5000万?

    来源:毒舌科技作者:潘磊雷克萨斯的高管,好像出事了。五六家日本小媒体,突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元(约合人民币5000
  • Web3 去中心化身份管理系统的历史、现状与展望

    身份、数字资产和在线资料的映射最近在区块链行业获得了极大的关注。新技术正在形成架构,这将进一步为去中心化和以用户为中心的机制铺平道路。本文将讨论以下
  • 8个最适合艺术家发行NFT的交易市场

    近年来,加密风靡全球。加密圈最令人兴奋的方面之一是它能够用于创建称为NFT 的数字资产。从 CyberKitties 到 Cyber Galleries,NFT 已成为艺术家和艺术鉴赏家的
  • 《刀剑神域》VR展开幕;《Puzzling Places》发布第二个付费DLC

    今日热点:《刀剑神域:Ex-Chronicle Online Edition》VR展开幕;虚拟活动平台EventX再获800万美元B轮融资;VR射击游戏《Outlier》确认将于3月17日登陆Steam平台等。
  • 2030年的元宇宙产业将会如何发展?

    对互联网巨头传统业务的反垄断政策倒逼互联网企业颠覆创新,寻找新的增长点,移动互联网流量空间见顶之际,元宇宙时代红利已然开启。序章:元宇宙应用场景大猜想元宇
  • NFT领域,我们是否应该遵守版权法

    NFTs中最有争议的因素之一是你是否真的 "拥有 "你所购买的艺术品。除此之外,围绕着NFT行业内的版权和知识产权盗窃的问题也同样重要,因为人们很容易误解这些事情
  • 3月份值得关注的5个NFT项目

    2021年,我们见证了一个新的创造者经济的诞生。它是在区块链上诞生的。自从NFT成为流行文化的中心舞台以来,有些艺术家们已经成为了NFT的超级明星,在几个月的时间
  • 元宇宙+剧本杀:“在异世界里当演员”

    你玩过剧本杀吗?体验过“元宇宙+剧本杀”吗?2月,恒信东方推出了一款次时代剧本杀原创作品——《失落的王朝》。其剧本和线索以数字化资产打造,通过VR技术塑造了与
  • 元宇宙不完全是想出来的,而是实打实做出来的

    沈阳强调,元宇宙不完全是想出来的,而是靠实打实做出来的;互联网向三维化升级是已经明确的大方向,这意味着大量的资金和技术会持续涌入。跨入2022年,元宇宙并没有“
Top