当前位置:首页 > 元宇宙 > AI

DeepSeek 开源进度 2 5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

来源: 责编: 时间:2025-02-26 12:23:46 163观看
导读 2 月 25 日消息,DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。附开源地址:https://github.com/deepseek-ai/DeepEP官方表示其具备如下

2 月 25 日消息,DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。GYM28资讯网——每日最新资讯28at.com

附开源地址:https://github.com/deepseek-ai/DeepEPGYM28资讯网——每日最新资讯28at.com

GYM28资讯网——每日最新资讯28at.com

官方表示其具备如下特征:GYM28资讯网——每日最新资讯28at.com

高效优化的全到全通信方式GYM28资讯网——每日最新资讯28at.com

支持节点内外通信,兼容 NVLink 和 RDMA 技术GYM28资讯网——每日最新资讯28at.com

提供高吞吐量的内核,提升训练和推理前期填充效率GYM28资讯网——每日最新资讯28at.com

提供低延迟内核,优化推理解码速度GYM28资讯网——每日最新资讯28at.com

完全支持 FP8 数据格式调度GYM28资讯网——每日最新资讯28at.com

提供灵活的 GPU 资源管理,支持计算与通信的重叠执行GYM28资讯网——每日最新资讯28at.com

详细介绍的大意如下:GYM28资讯网——每日最新资讯28at.com

DeepEP 是一款专为混合专家(MoE)和专家并行(EP)设计的通信库,提供了高吞吐量和低延迟的 all-to-all GPU 内核,常用于 MoE 派发和合并操作。该库还支持低精度计算,包括 FP8。GYM28资讯网——每日最新资讯28at.com

为了与 DeepSeek-V3 论文中提出的组限制门控算法兼容,DeepEP 提供了一些针对不对称带宽转发优化的内核,比如将数据从 NVLink 域转发到 RDMA 域。这些优化的内核能够提供高吞吐量,适合用于训练和推理的预填充任务,同时支持 SM(流式多处理器)数量控制。GYM28资讯网——每日最新资讯28at.com

对于延迟敏感型的推理解码任务,DeepEP 提供了一套低延迟内核,采用纯 RDMA 技术以最大程度减少延迟。此外,该库还采用了一种基于 Hook 的通信与计算重叠方法,不会占用任何 SM 资源。GYM28资讯网——每日最新资讯28at.com

需求:GYM28资讯网——每日最新资讯28at.com

Hopper GPUs (may support more architectures or devices later)GYM28资讯网——每日最新资讯28at.com

Python 3.8 及以上版本GYM28资讯网——每日最新资讯28at.com

CUDA 12.3 及以上版本GYM28资讯网——每日最新资讯28at.com

PyTorch 2.1 及以上版本GYM28资讯网——每日最新资讯28at.com

使用 NVLink 进行节点间通信GYM28资讯网——每日最新资讯28at.com

基于 RDMA 网络的节点间通信GYM28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11125-0.htmlDeepSeek 开源进度 2 5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 上海明星 AI 公司“澜码科技”曝“员工停薪社保停缴”,创始人周健回应称“借钱卖房补偿,正寻求被并购的可能性”

下一篇: 阿里 Qwen Chat 平台上线“深度思考”功能:基于 QwQ-Max-Preview 推理模型,支持联网搜索

标签:
  • 热门焦点
  • AI特效、虚拟人、数字盲盒,来看看元宇宙如何融合冬奥会!

    今天是冬奥会比赛的第12天,截至目前所累计的成绩,中国代表团已经取得了冬奥历史最佳战绩。全世界的人都在关注着这场盛事,为奥运健儿呐喊助威。谷爱凌、徐梦桃、
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
  • NFT:新骗局的狩猎场

    骗局的自动化需要更好的防御,从数字身份开始。前几天我在OpenSea上购买了一个NFT,是才华横溢的艺术家海伦·福尔摩斯 (Helen Holmes) 的漫画,来自她的 "原作 "收
  • 元宇宙风归何处?

    元宇宙持续大火,在过去一段时间内,其屡次登上热点,吸引了一波又一波投资者。近期,在“2022中国·金鱼嘴元宇宙生态赋能大会”上,南京建邺区金鱼嘴基金街区宣布计划
  • NFT自动售货机来啦!

    “纽约市有一台售卖 Solana NFT 的自动售货机,用信用卡就能买”Solana NFT 市场 Neon 可让您使用信用卡亲自购买 NFT,无需使用加密货币。由于基于 Solana 链的 N
  • 美国单曲排行榜Billboard和World of Women合作推出NFT杂志封面

    今天,Billboard宣布与流行的NFT头像集World of Women(WoW)建立新的伙伴关系,向NFT生态系统又迈进了一步。在这次合作中,WoW的创建者Yam Karkai将帮助这个音乐行业巨
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
  • 音乐家如何利用NFTs来提高歌迷参与度

    "音乐是一种语言,不以特定的文字说话。它用情感说话,如果它在骨子里,它就在骨子里。" - Keith Richards音乐激励着我们,使我们流泪,使我们充满狂喜,并抚慰我们的灵魂
  • 售出6930万美元的NFT已经过去一年,NFT如今是否已成为主流?

    Everydays: the First 5000 Days/Beeple去年三月,一件艺术品被著名拍卖行佳士得以6930万美元的高价售出。而让人们感到震惊的是,这个拍卖作品不是出自哪位艺术大
Top