当前位置:首页 > 元宇宙 > AI

DeepSeek 开源进度 2 5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

来源: 责编: 时间:2025-02-26 12:23:46 234观看
导读 2 月 25 日消息,DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。附开源地址:https://github.com/deepseek-ai/DeepEP官方表示其具备如下

2 月 25 日消息,DeepSeek 的“开源周”活动今日已经来到第二天,今天发布的是首个开源的用于 MoE 模型训练和推理的 EP 通信库 ——DeepEP。hIM28资讯网——每日最新资讯28at.com

附开源地址:https://github.com/deepseek-ai/DeepEPhIM28资讯网——每日最新资讯28at.com

hIM28资讯网——每日最新资讯28at.com

官方表示其具备如下特征:hIM28资讯网——每日最新资讯28at.com

高效优化的全到全通信方式hIM28资讯网——每日最新资讯28at.com

支持节点内外通信,兼容 NVLink 和 RDMA 技术hIM28资讯网——每日最新资讯28at.com

提供高吞吐量的内核,提升训练和推理前期填充效率hIM28资讯网——每日最新资讯28at.com

提供低延迟内核,优化推理解码速度hIM28资讯网——每日最新资讯28at.com

完全支持 FP8 数据格式调度hIM28资讯网——每日最新资讯28at.com

提供灵活的 GPU 资源管理,支持计算与通信的重叠执行hIM28资讯网——每日最新资讯28at.com

详细介绍的大意如下:hIM28资讯网——每日最新资讯28at.com

DeepEP 是一款专为混合专家(MoE)和专家并行(EP)设计的通信库,提供了高吞吐量和低延迟的 all-to-all GPU 内核,常用于 MoE 派发和合并操作。该库还支持低精度计算,包括 FP8。hIM28资讯网——每日最新资讯28at.com

为了与 DeepSeek-V3 论文中提出的组限制门控算法兼容,DeepEP 提供了一些针对不对称带宽转发优化的内核,比如将数据从 NVLink 域转发到 RDMA 域。这些优化的内核能够提供高吞吐量,适合用于训练和推理的预填充任务,同时支持 SM(流式多处理器)数量控制。hIM28资讯网——每日最新资讯28at.com

对于延迟敏感型的推理解码任务,DeepEP 提供了一套低延迟内核,采用纯 RDMA 技术以最大程度减少延迟。此外,该库还采用了一种基于 Hook 的通信与计算重叠方法,不会占用任何 SM 资源。hIM28资讯网——每日最新资讯28at.com

需求:hIM28资讯网——每日最新资讯28at.com

Hopper GPUs (may support more architectures or devices later)hIM28资讯网——每日最新资讯28at.com

Python 3.8 及以上版本hIM28资讯网——每日最新资讯28at.com

CUDA 12.3 及以上版本hIM28资讯网——每日最新资讯28at.com

PyTorch 2.1 及以上版本hIM28资讯网——每日最新资讯28at.com

使用 NVLink 进行节点间通信hIM28资讯网——每日最新资讯28at.com

基于 RDMA 网络的节点间通信hIM28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11125-0.htmlDeepSeek 开源进度 2 5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 上海明星 AI 公司“澜码科技”曝“员工停薪社保停缴”,创始人周健回应称“借钱卖房补偿,正寻求被并购的可能性”

下一篇: 阿里 Qwen Chat 平台上线“深度思考”功能:基于 QwQ-Max-Preview 推理模型,支持联网搜索

标签:
  • 热门焦点
  • 从科幻走进现实,元宇宙概念逐渐清晰

    2021年,元宇宙概念如同一颗炸弹投进互联网行业,掀起了一场数字海啸,众多企业纷纷入局,在此新领域展开新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻红,元宇宙走进资本圈2021年3
  • 完美世界被元宇宙“拒之门外”

    春节期间,游戏是消磨时间最好的方式,完美世界的《幻塔》作为选择的首要目标,倒不是因为它的吸引力有多大,纯粹是广大网友的吐槽。继《原神》之后,进击元宇宙的游戏
  • 智能人机交互技术的春晚大考

    1月初的一个早晨,京东智能客户服务产品部紧急开会,进行关于尚未对外公布的“X项目”的初讨论。1月5日,这个神秘的X项目对外公布,京东成为央视2022年春晚独家互动合
  • 借VR产业东风,江西抢滩布局“元宇宙”

    自2016年起就在VR上倾注了大量精力的江西省,迅速搭上了“元宇宙”。VR、AR等技术是通往元宇宙的关键接口,使人们可以在数字空间和物理空间自由穿梭。自2016年起
  • 从英式拍到荷兰拍,看传统金融拍卖玩法如何玩转NFT市场交易

    作者:鲁拍卖是一种从古至今的商业活动。从古代的典当到现代的拍卖市场、我们熟知的拍卖行,以及知名街头艺术家Bansky名画拍卖成功后,竟自毁粉碎,现价值又翻倍的拍
  • 以太坊伦敦升级后,随之生效的以太坊EIP-1559是什么?

    作者:三黎过去的一年里,除了 BTC 一如既往稳坐王位,DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时,也使得其网络日渐拥堵、交易费用增高,成为
  • 暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗?

    NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造,该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
  • 艺术创作者能否永久收取版税?

    NFTs正在改变我们理解互联网所有权的方式,社区管理的所有权有很多好处,但如果创作者想为他/她的创作获得永久的收益(版税),会发生什么?这不是一个容易解决的问题,版税
  • 知名艺术家打造去中心化“好莱坞”:一部电影一个DAO

    根据市场追踪网站 DappRadar 的数据,随着 NFT 的“出圈”与加密货币的普及,NFT 市场在 2021 年的销售额达到约 250 亿美元,而 2020 年仅为 9490 万美元,同比增超 2
Top