当前位置:首页 > 科技  > 数码

努力替代CUDA!摩尔线程Torch-MUSA插件升级v1.3.0 完全开源

来源: 责编: 时间:2024-11-01 09:30:19 186观看
导读 快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性

快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。fNF28资讯网——每日最新资讯28at.com

新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度,能更友好地支持模型迁移到摩尔线程GPU。fNF28资讯网——每日最新资讯28at.com

PyTorch是全球广泛使用的深度学习框架,在自然语言处理、计算机视觉、推荐系统等多个领域展现出了强大的应用能力。fNF28资讯网——每日最新资讯28at.com

摩尔线程Torch-MUSA专为PyTorch提供MUSA后端加速支持,使得用户能够在MUSA架构上流畅运行深度学习模型,充分发挥国产全功能GPU的强大计算能力。fNF28资讯网——每日最新资讯28at.com

自发布以来,Torch-MUSA已历经多个版本的迭代,不断提升兼容性与性能。fNF28资讯网——每日最新资讯28at.com

Torch-MUSA v1.0.0版本开始,率先支持了PyTorch 2.0,带来了显著的计算加速和易用性。fNF28资讯网——每日最新资讯28at.com

经过持续的开发与优化,新发布的v1.3.0版本已全面支持PyTorch 2.2.0,极大提升了模型训练与推理的效率,满足了更多高性能深度学习任务的需求。fNF28资讯网——每日最新资讯28at.com

目前,Torch-MUSA已完全开源,开发者可通过访问GitHub获取源代码。fNF28资讯网——每日最新资讯28at.com

摩尔线程鼓励开发者积极参与该项目的开发与改进,通过提交问题报告(issue)或代码修改申请(pull request)等方式,共同促进Torch-MUSA以及MUSA软件生态的持续进步和发展。fNF28资讯网——每日最新资讯28at.com

努力替代CUDA!摩尔线程Torch-MUSA插件升级v1.3.0 完全开源fNF28资讯网——每日最新资讯28at.com

▼ Torch-MUSA开源地址:fNF28资讯网——每日最新资讯28at.com

https://github.com/MooreThreads/torch_musafNF28资讯网——每日最新资讯28at.com

▼ 功能特性fNF28资讯网——每日最新资讯28at.com

在Torch-MUSA中,用户只需指定torch.device("musa"),即可轻松将现有的PyTorch模型迁移到MUSA架构的GPU上运行,无需大幅修改代码。fNF28资讯网——每日最新资讯28at.com

Torch-MUSA完全兼容PyTorch的自动微分和动态图机制,支持多种常用的神经网络模块及优化算法,并加速了关键深度学习算子的计算。fNF28资讯网——每日最新资讯28at.com

此外,Torch-MUSA还支持多种PyTorch特性,包括DDP、JIT、FSDP、Profiler、Extension等。fNF28资讯网——每日最新资讯28at.com

▼ 版本迭代fNF28资讯网——每日最新资讯28at.com

v1.1.0:fNF28资讯网——每日最新资讯28at.com

初次发布,支持PyTorch 2.0,提供基础张量操作和常见神经网络层的MUSA加速。fNF28资讯网——每日最新资讯28at.com

v1.2.0:fNF28资讯网——每日最新资讯28at.com

进一步扩展算子支持,支持了完整功能的Profiler、MUSA Extension,并增加了Torch-MUSA专有特性如compare_tool、musa_converter,帮助用户更快的定位模型精度问题。fNF28资讯网——每日最新资讯28at.com

v1.3.0:fNF28资讯网——每日最新资讯28at.com

支持PyTorch2.2.0,性能进一步提升,支持FSDP,支持更复杂的模型和更大规模的数据处理。fNF28资讯网——每日最新资讯28at.com

▼ 未来计划fNF28资讯网——每日最新资讯28at.com

Torch-MUSA将继续跟进PyTorch的版本更新,计划支持更高版本的PyTorch。fNF28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-123390-0.html努力替代CUDA!摩尔线程Torch-MUSA插件升级v1.3.0 完全开源

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: AMD首次公开确认!明年初发布RDNA4显卡:光追性能提升、新增AI功能

下一篇: AMD新一代Radeon显卡RDNA 4正式官宣:两大升级 一大遗憾!

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • Redmi Pad评测:红米充满野心的一次尝试

    从Note系列到K系列,从蓝牙耳机到笔记本电脑,红米不知不觉之间也已经形成了自己颇有竞争力的产品体系,在中端和次旗舰市场上甚至要比小米新机的表现来得更好,正所谓“大丈夫生居
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • WebRTC.Net库开发进阶,教你实现屏幕共享和多路复用!

    WebRTC.Net库:让你的应用更亲民友好,实现视频通话无痛接入! 除了基本用法外,还有一些进阶用法可以更好地利用该库。自定义 STUN/TURN 服务器配置WebRTC.Net 默认使用 Google 的
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 新电商三兄弟,“抖快红”成团!

    来源:价值研究所作 者:Hernanderz 随着内容电商的概念兴起,抖音、快手、小红书组成的“新电商三兄弟”成为业内一股不可忽视的势力,给阿里、京东、拼多多带去了巨大压
  • 自研Exynos回归!三星Galaxy S24系列将提供Exynos和骁龙双版本

    年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,虽同样采用台积电4nm工艺制
Top