当前位置:首页 > 科技  > 数码

摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

来源: 责编: 时间:2025-09-15 11:47:04 118观看
导读 快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。SimuMax是一款专为大语言模

快科技9月11日消息,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax v1.0,在显存和性能仿真精度上实现了突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性。Azq28资讯网——每日最新资讯28at.com

SimuMax是一款专为大语言模型(LLM)分布式训练负载设计的仿真模拟工具,可为从单卡到万卡集群提供仿真支持。Azq28资讯网——每日最新资讯28at.com

它无需实际执行完整训练过程,即可高精度模拟训练中的显存使用和性能表现,帮助用户提前了解训练效率,优化计算效能。Azq28资讯网——每日最新资讯28at.com

基于静态分析模型,摩尔线程自研的SimuMax通过结合成本模型、内存模型和屋顶模型,实现对训练过程的精准仿真。Azq28资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%Azq28资讯网——每日最新资讯28at.com

该工具支持多种主流分布式并行策略与优化技术,适用于以下多种应用场景:Azq28资讯网——每日最新资讯28at.com

1、并行策略:Azq28资讯网——每日最新资讯28at.com

数据并行(DP)、张量并行(TP)、序列并行(SP)、流水线并行(PP)、专家并行(EP)Azq28资讯网——每日最新资讯28at.com

2、优化技术:Azq28资讯网——每日最新资讯28at.com

ZeRO-1、完整重计算、选择性重计算、融合内核等。Azq28资讯网——每日最新资讯28at.com

3、适用对象:Azq28资讯网——每日最新资讯28at.com

希望寻找优训练策略以提升效率的用户;Azq28资讯网——每日最新资讯28at.com

从事框架或大模型算法开发的工程师,用于优化与调试;Azq28资讯网——每日最新资讯28at.com

芯片制造商,用于性能预测与硬件设计辅助。Azq28资讯网——每日最新资讯28at.com

SimuMax 1.0显著的更新在于其仿真精度的大幅提升,为用户提供更可靠的分析结果。Azq28资讯网——每日最新资讯28at.com

针对Dense和MoE(混合专家)模型,显存估计误差稳定控制在1%以内。Azq28资讯网——每日最新资讯28at.com

经测试,在多个主流GPU上,目前优性能估计误差持续低于4%。Azq28资讯网——每日最新资讯28at.com

摩尔线程发布大模型训练仿真工具SimuMax v1.0:精度显著提升 显存误差仅1%Azq28资讯网——每日最新资讯28at.com

此外,SimuMax 1.0还引入了多项新特性,支持更广泛的模型结构和高效率训练需求:Azq28资讯网——每日最新资讯28at.com

MLA支持:Azq28资讯网——每日最新资讯28at.com

新增对MLA模型架构的支持;Azq28资讯网——每日最新资讯28at.com

流水线并行(PP)增强:Azq28资讯网——每日最新资讯28at.com

支持对首阶段和末阶段层的细粒度控制,优化模型分片策略;Azq28资讯网——每日最新资讯28at.com

MoE灵活性提升:Azq28资讯网——每日最新资讯28at.com

在混合专家(MoE)模型中支持自定义Dense层,为模型设计提供了更大的灵活性。Azq28资讯网——每日最新资讯28at.com

Megatron兼容:Azq28资讯网——每日最新资讯28at.com

提供简化的模型迁移流程,可轻松转换和分析基于Megatron框架的模型,提升与现有生态的互操作性。Azq28资讯网——每日最新资讯28at.com

重计算策略优化:Azq28资讯网——每日最新资讯28at.com

实现更细粒度的选择性重计算,支持更精准的内存和计算资源权衡。Azq28资讯网——每日最新资讯28at.com

全面的效率分析:Azq28资讯网——每日最新资讯28at.com

新增对不同张量形状与内存布局下计算效率与利用率的评估功能。Azq28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-181767-0.html摩尔线程发布大模型训练仿真工具SimuMax v1.0:显存误差仅1%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: RTX 5090/5080公版开始消失了!

下一篇: 突然!美国将23家中企列入实体清单 含13家集成电路企业:我国曾多次回应

标签:
  • 热门焦点
  • K60至尊版刚预热 一加Ace2 Pro正面硬刚

    Redmi这边刚如火如荼的宣传了K60 Ultra的各种技术和硬件配置,作为竞品的一加也坐不住了。一加中国区总裁李杰发布了两条微博,表示在自家的一加Ace2上早就已经采用了和PixelWo
  • Redmi Buds 4开箱简评:才199还有降噪 可以无脑入

    在上个月举办的Redmi Note11T Pro系列新机发布会上,除了两款手机新品之外,Redmi还带来了两款TWS真无线蓝牙耳机产品,Redmi Buds 4和Redmi Buds 4 Pro,此前我们在Redmi Note11T
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • 慕岩炮轰抖音,百合网今何在?

    来源:价值研究所 作者:Hernanderz“难道就因为自己的一个产品牛逼了,从客服到总裁,都不愿意正视自己产品和运营上的问题,选择逃避了吗?”这一番话,出自百合网联合创
  • 梁柱接棒两年,腾讯音乐闯出新路子

    文丨田静 出品丨牛刀财经(niudaocaijing)7月5日,企鹅FM发布官方公告称由于业务调整,将于9月6日正式停止运营,这意味着腾讯音乐长音频业务走向消亡。腾讯在长音频领域还在摸索。为
  • 微博大门常打开,迎接海外画师漂洋东渡

    作者:互联网那些事“起猛了,我能看得懂日语了”。“为什么日本人说话我能听懂?”“中文不像中文,日语不像日语,但是我竟然看懂了”…&hell
  • 小米汽车电池信息疑似曝光:容量101kWh,支持800V高压快充

    7月14日消息,今日一名博主在社交媒体发布了一张疑似小米汽车电池信息的照片,显示该电池包正是宁德时代麒麟电池,容量为101kWh,电压为726.7V,可以预测小
  • 华为和江淮汽车合作开发百万元问界MPV?双方回应来了

    8月1日消息,郭明錤今天在社交平台发文称,华为正在和江淮汽车合作,开发售价在100万元的问界MPV,预计在2024年第2季度量产,销量目标为上市首年交付5万辆。
  • 超级标准版旗舰!iQOO 11S全球首发iQOO超算独显芯片

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
Top