当前位置:首页 > 科技  > 软件

解锁超凡生成式 AI 能力:TensorRT 加速 RTX PC 和工作站上的 AI

来源: 责编: 时间:2024-03-28 17:45:10 260观看
导读 +++编者注: 本文属于《解码 AI》系列栏目,该系列的目的是让技术更加简单易懂,从而解密 AI, 同时向 RTX PC 用户展示全新硬件、软件、工具和加速特性。随着生成式 AI 技术不断进步并在各行各业中得到广泛应用,在

2pz28资讯网——每日最新资讯28at.com

+++2pz28资讯网——每日最新资讯28at.com

编者注: 本文属于《解码 AI》系列栏目,该系列的目的是让技术更加简单易懂,从而解密 AI, 同时向 RTX PC 用户展示全新硬件、软件、工具和加速特性。2pz28资讯网——每日最新资讯28at.com

随着生成式 AI 技术不断进步并在各行各业中得到广泛应用,在本地 PC 和工作站上运行生成式 AI 应用的重要性越来越高。本地推理可让用户享受更低的延迟,不再依赖网络,并能够更好地保护和管理自己的本地数据。2pz28资讯网——每日最新资讯28at.com

NVIDIA GeForce 和 NVIDIA RTX GPU 配备专用的 AI 硬件加速器 Tensor Core, 可为在本地运行生成式 AI 提供强大动力。2pz28资讯网——每日最新资讯28at.com

NVIDIA TensorRT 软件开发者套件现已针对 Stable Video Diffusion 进行优化,该套件可在超过 1 亿台由 RTX GPU 提供支持的 Windows PC 和工作站上解锁超高性能生成式 AI。优化的 Stable Video Diffusion 1.1 Image-to-Video 模型可以在 Hugging Face 上下载。2pz28资讯网——每日最新资讯28at.com

适用于 Automatic1111 开发的热门 Stable Diffusion WebUI 的 TensorRT 扩展程序现已添加对 ControlNet 的支持。ControlNet 是一种工具,可以让用户添加其他图像作为指导,以便更好地把控并优化生成式内容的输出。2pz28资讯网——每日最新资讯28at.com

全新的 UL Procyon AI 图像生成基准测试现已支持 TensorRT 加速,内部测试表明该基准测试可以准确复现实际性能表现。与最快的非 TensorRT 加速状态相比,TensorRT 加速可在 GeForce RTX 4080 SUPER GPU 上带来 50% 的速度提升,比实力最接近的竞品快 1 倍以上。2pz28资讯网——每日最新资讯28at.com

更高效、更精准的 AI2pz28资讯网——每日最新资讯28at.com

TensorRT 使开发者能够得到完全优化的 AI 硬件体验。与在其他框架上运行应用相比,AI 性能通常会翻倍。2pz28资讯网——每日最新资讯28at.com

TensorRT 还能加速非常热门的生成式 AI 模型,例如 Stable Diffusion 和 SDXL。Stable Video Diffusion 是 Stability AI 的 Image-to-Video 生成式 AI 模型,在 TensorRT 的助力下,其速度可提升 40%。2pz28资讯网——每日最新资讯28at.com

此外,适用于 Stable Diffusion WebUI 的 TensorRT 扩展程序至高可将性能提升至原来的 2 倍,从而大幅加速 Stable Diffusion 工作流。2pz28资讯网——每日最新资讯28at.com

此扩展程序的最新更新使 TensorRT 的优化可扩展至 ControlNet。ControlNet 是一组 AI 模型,可借助额外控制来引导扩散模型的输出。在 TensorRT 的助力下,ControlNet 的速度可提高 40%。2pz28资讯网——每日最新资讯28at.com

2pz28资讯网——每日最新资讯28at.com

用户可以引导输出的各个方面,使其与输入图像匹配,这使他们能够加强对最终图像的把控。他们还可以同时使用多个 ControlNet 来更好地把控输出。ControlNet 可以使用深度图、边缘图、法线图或关键点检测模型等。2pz28资讯网——每日最新资讯28at.com

立即在 GitHub 上下载适用于 Stable Diffusion WebUI 的 TensorRT 扩展程序。2pz28资讯网——每日最新资讯28at.com

由 TensorRT 加速的其他热门应用2pz28资讯网——每日最新资讯28at.com

Blackmagic Design 在 DaVinci Resolve 的 18.6 更新中采用了 NVIDIA TensorRT 加速。与 Mac 相比,DaVinci Resolve 的神奇遮罩、光流 (Speed Warp) 和 Super Scale 等 AI 工具在 RTX GPU 上的运行速度提高了 50% 以上,最高可达在 Mac 上的 2.3 倍。2pz28资讯网——每日最新资讯28at.com

此外,借助 TensorRT 集成,Topaz Labs 的 Photo AI 和 Video AI 应用 (例如照片降噪、锐化、照片超分辨率、视频慢动作、视频超分辨率、视频防抖等) 在 RTX 上运行时,性能至高可提升 60%。2pz28资讯网——每日最新资讯28at.com

将 Tensor Core 与 TensorRT 软件结合后,本地 PC 和工作站可获得卓越的生成式 AI 性能。此外,本地运行拥有以下优势:2pz28资讯网——每日最新资讯28at.com

●性能增强: 用户将体验到更低的延迟,因为当整个模型在本地运行时,延迟不受网络质量影响。这对于游戏或视频会议等实时用例非常重要。NVIDIA RTX 提供超快的 AI 加速器,可将 AI 运算速度扩展至超过 1300 万亿次运算 / 秒 (TOPS)。2pz28资讯网——每日最新资讯28at.com

●成本降低: 用户无需承担与大型语言模型推理相关的云服务、云托管 API 或基础设施的成本。2pz28资讯网——每日最新资讯28at.com

●随时访问: 用户可以随时随地访问 LLM 功能,无需依赖高带宽网络连接。2pz28资讯网——每日最新资讯28at.com

●数据隐私无虞: 私人和专有数据可始终保留在用户的设备上。2pz28资讯网——每日最新资讯28at.com

针对 LLM 优化2pz28资讯网——每日最新资讯28at.com

了解 TensorRT 为深度学习带来了哪些优势,以及 NVIDIA TensorRT-LLM 为最新的 LLM 带来了哪些优势。2pz28资讯网——每日最新资讯28at.com

TensorRT-LLM 是一个可加速和优化 LLM 推理的开源库,包含对热门社区模型 (Phi-2、Llama2、Gemma、Mistral 和 Code Llama 等) 的开箱即用支持。无论是开发者和创作者,还是企业员工和普通用户,任何人都可以在 NVIDIA AI 游乐园中试用经 TensorRT-LLM 优化的模型。此外,通过使用 NVIDIA ChatRTX 技术演示软件,用户可以了解在 Windows PC 上本地运行的各种模型的性能。ChatRTX 基于 TensorRT-LLM 构建,可优化 RTX GPU 上模型的性能。2pz28资讯网——每日最新资讯28at.com

借助新的封装器,适用于 Windows 的 TensorRT-LLM 可与 OpenAI 的热门聊天 API 兼容,您可以选择在云端或是在本地 RTX 系统上运行 LLM 应用,并在二者之间轻松切换。2pz28资讯网——每日最新资讯28at.com

NVIDIA 正在与开源社区合作,开发适用于热门应用框架 (包括 LlamaIndex 和 LangChain) 的原生 TensorRT-LLM 连接器。2pz28资讯网——每日最新资讯28at.com

这些创新使开发者能够轻松将 TensorRT-LLM 与其应用结合使用,并通过 RTX 体验卓越 LLM 性能。2pz28资讯网——每日最新资讯28at.com

请订阅《解码 AI》时事通讯,我们每周都会将新鲜资讯直接投递到您的收件箱。2pz28资讯网——每日最新资讯28at.com

###2pz28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-80013-0.html解锁超凡生成式 AI 能力:TensorRT 加速 RTX PC 和工作站上的 AI

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 2024 年,这些 VS Code 插件可以卸载了!

下一篇: 清明节将至,“AI 复活”爆火!有公司忙到接不过来单

标签:
  • 热门焦点
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • vivo TWS Air开箱体验:真轻 臻好听

    在vivo S15系列新机的发布会上,vivo的最新款真无线蓝牙耳机vivo TWS Air也一同发布,本次就这款耳机新品给大家带来一个简单的分享。外包装盒上,vivo TWS Air保持了vivo自家产
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 零售大模型“干中学”,攀爬数字化珠峰

    文/侯煜编辑/cc来源/华尔街科技眼对于绝大多数登山爱好者而言,攀爬珠穆朗玛峰可谓终极目标。攀登珠峰的商业路线有两条,一是尼泊尔境内的南坡路线,一是中国境内的北坡路线。相
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • 2299元起!iQOO Pad明晚首销:性能最强天玑平板

    5月23日,iQOO如期举行了新品发布会,除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外,还在发布会上推出了旗下首款平板电脑——iQOO Pad,其最大的卖点
  • 机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

    7月20日消息,据外媒报道,研究机构的报告显示,由于需求下滑,今年二季度全球智能手机的出货量,同比下滑了11%,三星、苹果等主要厂商的销量,较去年同期均有下
  • DRAM存储器10月价格下跌,NAND闪存本月价格与上月持平

    10月30日,据韩国媒体消息,自今年年初以来一直在上涨的 DRAM 存储器的交易价格仅在本月就下跌了近 10%,此次是全年首次降价,而NAND 闪存本月价格与上月持平。市
Top