当前位置:首页 > 科技  > 数码

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

来源: 责编: 时间:2024-08-20 09:02:13 218观看
导读 快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。夸娥1.2主要升级

快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。JZa28资讯网——每日最新资讯28at.com

夸娥1.2主要升级点:JZa28资讯网——每日最新资讯28at.com

▼MFU提升10% 高可达55%JZa28资讯网——每日最新资讯28at.com

在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。JZa28资讯网——每日最新资讯28at.com

稠密模型集群训练中,MFU高达到55%。JZa28资讯网——每日最新资讯28at.com

▼Flash Attention2优化JZa28资讯网——每日最新资讯28at.com

通过集成新的MUSA SDK平台与优化后的Flash Attention2技术,结合新版Torch MUSA和算子融合,显著提升了大模型训练的效率与资源利用率,大幅缩短训练周期,并降低了整体成本。JZa28资讯网——每日最新资讯28at.com

▼64K长文本支持JZa28资讯网——每日最新资讯28at.com

增强了对长文本大模型训练的支持,优化了处理长文本理解和生成任务的能力,能够更好地应对文档摘要、文章写作等复杂语言处理任务。JZa28资讯网——每日最新资讯28at.com

▼支持混合专家模型MoEJZa28资讯网——每日最新资讯28at.com

MCCL通信库完成了All2All优化,并针对muDNN算子在不同形状下的矩阵运算进行了优化,以更好地支持MoE(Mixture of Experts)大模型的训练。JZa28资讯网——每日最新资讯28at.com

这不仅提升了智算效率,还为更大规模参数的大模型训练提供了高度可扩展的基础。JZa28资讯网——每日最新资讯28at.com

▼断点续训JZa28资讯网——每日最新资讯28at.com

进一步提升了大模型训练的Checkpoint(检查点)读写性能,写入时间小于2秒,显著提高训练效率。JZa28资讯网——每日最新资讯28at.com

▼优化DeepSpeedJZa28资讯网——每日最新资讯28at.com

支持DeepSpeed、Ulysses的适配和性能优化,强化了长文本训练支持。JZa28资讯网——每日最新资讯28at.com

适配国内外多款大模型,在Hugging Face上支持训练和微调主要的开源大模型,创新型企业可以灵活选择不同的大模型开发智能应用。JZa28资讯网——每日最新资讯28at.com

▼稳定性提升JZa28资讯网——每日最新资讯28at.com

千卡集群软硬件进一步成熟,实现了连续无故障训练长达15天。JZa28资讯网——每日最新资讯28at.com

新版本引入了KUAE Aegis可靠性功能,加强了对GPU、显存、集合通信等方面的监控、自动诊断与故障恢复能力。JZa28资讯网——每日最新资讯28at.com

▼可视化/可观测JZa28资讯网——每日最新资讯28at.com

引入了PerfSight性能监控系统,可实时显示模型训练过程中的资源消耗与性能分析数据,有助于快速发现并恢复训练期间的故障,满足大模型上的性能调优需求。JZa28资讯网——每日最新资讯28at.com

▼内置模型库中新增大模型JZa28资讯网——每日最新资讯28at.com

KUAE内置模型库Model Zoo新增LLaMA2全系列大模型、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型。JZa28资讯网——每日最新资讯28at.com

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2JZa28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-108653-0.html连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: AOC推出新款24寸显示器:2K 120Hz屏首发仅749元

下一篇: 7月中国主板市场遇冷:华硕稳居首位 成唯一增长品牌

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 5月安卓手机好评榜:魅族20 Pro夺冠

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年5月1日至5月31日,仅限国内市场。第一名:魅族20 Pro好评率:97.50%不得不感慨魅族老品牌还
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • “又被陈思诚骗了”

    作者|张思齐 出品|众面(ID:ZhongMian_ZM)如今的国产悬疑电影,成了陈思诚的天下。最近大爆电影《消失的她》票房突破30亿断层夺魁暑期档,陈思诚再度风头无两。你可以说陈思诚的
  • 超闭合精工铰链 彻底消灭缝隙 三星Galaxy Z Flip5与Galaxy Z Fold5发布

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。三星新一代折叠屏手机采用超闭合精工铰链,让折叠后的缝隙不再可见。同时,配合处
  • Android 14发布:首批适配机型公布

    5月11日消息,谷歌在今天凌晨举行了I/O大会,本次发布会谷歌带来了自家的AI语言模型PaLM 2、谷歌Pixel Fold折叠屏、谷歌Pixel 7a手机,同时发布了Androi
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
  • 联想的ThinkBook Plus下一版曝光,键盘旁边塞个平板

    ThinkBook Plus 是联想的一个特殊笔记本类别,它在封面放入了一块墨水屏,也给人留下了较为深刻的印象。据有人爆料,联想的下一款 ThinkBook Plus 可能更特殊,它
Top