当前位置:首页 > 科技  > 数码

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

来源: 责编: 时间:2024-04-12 09:01:05 344观看
导读 一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验ROCm:一个可移植、高性能的GPU计算平台随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家

一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

ROCm:一个可移植、高性能的GPU计算平台3hQ28资讯网——每日最新资讯28at.com

随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家将显卡当成AIGC生产力工具。3hQ28资讯网——每日最新资讯28at.com

只不过,Stable Diffusion的早期版本对AMD显卡支持不太友好,给大家造成了只有N卡才适合玩AI的错觉。3hQ28资讯网——每日最新资讯28at.com

可能很多同学不知道的是,AMD的Radeon GPU也是能够做深度学习的,而且性能也并不差。3hQ28资讯网——每日最新资讯28at.com

去年12月份,AMD推出的ROCm 6.0开发平台进一步优化了RX 7000系列显卡的AI性能,特别是Stable Diffusion的出图效率更是获得了翻倍提升。3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

这里先解释一下什么是AMD ROCm!3hQ28资讯网——每日最新资讯28at.com

ROCm (Radeon Open Compute Platform )是 AMD 基于开源项目的 GPU计算生态系统,类似于 NVIDIA 的 CUDA。3hQ28资讯网——每日最新资讯28at.com

ROCm 支持多种编程语言、编译器、库和工具,以加速科学计算、自动驾驶、人工智能和机器学习等领域的应用。3hQ28资讯网——每日最新资讯28at.com

ROCm还支持多种加速器厂商和架构,提供了开放的可移植性和互操作性。3hQ28资讯网——每日最新资讯28at.com

目前深度学习开发一般都是使用Python的,而大数据平台往往都会部署在Linux操作系统之上,因此,AMD ROCm目前主要精力放在Linux系统上,Windows端则还有待完善。3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

得益于双发射设计的流处理器单元,RX 7900 XT仅凭5376个流处理器就达到了55.4TFOPS的单精度浮点运算性能,而拥有10240个流处理器的RTX 4080 Super浮点性能同样也是55TFOPS。3hQ28资讯网——每日最新资讯28at.com

至于RX 7900 XTX,其单精度浮点性能则接近60TFOPS。3hQ28资讯网——每日最新资讯28at.com

Stable Diffusion主要依赖GPU的单精度浮点性能以及显存容量与带宽,这两方面RX 7900 XT都不逊于RTX 4080 SUPER,甚至显存容量还更大一些。3hQ28资讯网——每日最新资讯28at.com

现在有了AMD ROCm 6.0的加持,终于可以发挥出这张顶级显卡的强大的AI算力。3hQ28资讯网——每日最新资讯28at.com

二、Stable Diffusion出图速度对比:Linux系统下出图效率近乎翻倍3hQ28资讯网——每日最新资讯28at.com

测试平台如下:3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

本次我们主要对比RX 7900 XT/XTX在Ubuntu与windows系统下的出图效率,看看AMD ROCm到底能带来多大提升。3hQ28资讯网——每日最新资讯28at.com

1、RX 7900 XT对比测试3hQ28资讯网——每日最新资讯28at.com

首先是Windows 11系统,打开Stable Diffusion之后,我们设置DPN++ 2M Karras采样、迭代步数50、Euler a采样、1024x768分辨率、CFG为7、总批次10,单批数量1。3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

在Windows系统下,RX 7900 XT基于DirectML加速模式生成10张图共计耗时9分51秒,也就是591秒。3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

进入Ubuntu 22.04.3 LTS系统,设置好ROCm之后,同样的参数与模型生成10张图只用掉了5分05秒,即305秒。3hQ28资讯网——每日最新资讯28at.com

对比之下,在Ubuntu 22.04.3 LTS系统下,RX 7900 XT的出图效率相比Windows系统高了足足94%。3hQ28资讯网——每日最新资讯28at.com

2、RX 7900 XTX对比测试3hQ28资讯网——每日最新资讯28at.com

使用同样的参数来测试RX 7900 XTX显卡。3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

在Windows系统下,RX 7900 XTX基于DirectML加速模式生成10张图总计耗时9分18秒,也就是558秒。3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

进入Ubuntu 22.04.3 LTS系统,设置好ROCm之后,同样的参数与模型生成10张图只用掉了4分45秒,即285秒。3hQ28资讯网——每日最新资讯28at.com

在Ubuntu 22.04.3 LTS系统下,RX 7900 XTX的出图效率相比Windows系统领先了96%,也就是近乎翻倍的性能提升。3hQ28资讯网——每日最新资讯28at.com

三、小结:高性价比的AIGC显卡3hQ28资讯网——每日最新资讯28at.com

目前一张非公RX 7900 XT售价在5299元左右,对位的非公RTX 4080 Super售价则是8599元,N卡贵了60%。其实在游戏性能方面,这两款显卡并没有太大差距。3hQ28资讯网——每日最新资讯28at.com

现在AMD也意识到了AI应用对于GPU的重要性,加大了对AMD ROCm平台的投入,经过不断的更新,如今AMD ROCm 6.0在AI算力方面的提升早已超出了大多数玩家的预知。3hQ28资讯网——每日最新资讯28at.com

在我们的测试中,RX 7900 XT在Linux系统下使用Stable Diffusion ROCm 6.0版时,其出图效率几乎是Windows系统的2倍。再加上55TFOPS的单精度浮点运算性能以及20GB GDDR6X超大容量显存,对于有较高专业AIGC应用需求的专业用户而言,在有限的预算下,RX 7900 XT可以说是非常适合的选择。3hQ28资讯网——每日最新资讯28at.com

当然,也希望AMD能够继续优化ROCm在Windows系统下的性能表现,让更多的AMD用户能拥有自己的高性价比AIGC显卡。3hQ28资讯网——每日最新资讯28at.com

ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验3hQ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-83031-0.htmlROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 全球PC市场复苏:联想遥遥领先

下一篇: 7999元起 联想YOGA 27 2024一体机上市:可选RTX 4050独显

标签:
  • 热门焦点
  • 5月安卓手机好评榜:魅族20 Pro夺冠

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年5月1日至5月31日,仅限国内市场。第一名:魅族20 Pro好评率:97.50%不得不感慨魅族老品牌还
  • 微软邀请 Microsoft 365 商业用户,测试视频编辑器 Clipchamp

    8 月 1 日消息,微软近日宣布即将面向 Microsoft 365 商业用户,开放 Clipchamp 应用,邀请用户通过该应用来编辑视频。微软于 2021 年收购 Clipchamp,随后开始逐步整合到 Microsof
  • 慕岩炮轰抖音,百合网今何在?

    来源:价值研究所 作者:Hernanderz“难道就因为自己的一个产品牛逼了,从客服到总裁,都不愿意正视自己产品和运营上的问题,选择逃避了吗?”这一番话,出自百合网联合创
  • 新电商三兄弟,“抖快红”成团!

    来源:价值研究所作 者:Hernanderz 随着内容电商的概念兴起,抖音、快手、小红书组成的“新电商三兄弟”成为业内一股不可忽视的势力,给阿里、京东、拼多多带去了巨大压
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 消息称小米汽车开始筛选交付中心:需至少120个车位

    IT之家 7 月 7 日消息,日前,有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者 发文表示,据经销商集团反馈,小米汽车目前
  • AI芯片初创公司Tenstorrent获三星和现代1亿美元投资

    Tenstorrent是一家由芯片行业资深人士Jim Keller领导的加拿大初创公司,专注于开发人工智能芯片,该公司周三表示,已经从现代汽车集团和三星投资基金等
  • iQOO Neo8 Pro即将开售:到手价3099元起 安卓性能最强旗舰

    5月23日,iQOO如期举行了新品发布会,全新的iQOO Neo8系列也正式与大家见面,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更
  • 首发天玑9200+ iQOO Neo8系列发布首销售价2299元起

    2023年5月23日晚,iQOO Neo8系列正式发布。其中,Neo系列首款Pro之作——iQOO Neo8 Pro强悍登场,限时售价3099元起;价位段最强性能手机iQOO Neo8同期上市
Top