当前位置：首页 > 科技 > 数码

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

来源：责编：时间：2023-11-17 08:49:39 532观看

导读快科技11月16日消息，正在举行的微软Iginte全球技术大会上，微软发布一系列AI相关的全新优化模型、开发工具资源，帮助开发者更深入地释放硬件性能，拓展AI场景。尤是对于当下在AI领域占据绝对主导地位的NVIDIA来

快科技11月16日消息，正在举行的微软Iginte全球技术大会上，微软发布一系列AI相关的全新优化模型、开发工具资源，帮助开发者更深入地释放硬件性能，拓展AI场景。

尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说，微软这次送上了一份大礼包，无论是面向OpenAI Chat API的TensorRT-LLM封装接口，还是RTX驱动的性能改进DirectML for Llama 2，以及其他热门大语言模型(LLM)，都可以在NVIDIA硬件上获得更好的加速和应用。

其中，TensorRT-LLM是一款用于加速LLM推理的库，可大大提升AI推理性能，还在不断更以支持越来越多的语言模型，而且它还是开源的。

就在10月份，NVIDIA也发布了面向Windows平台的TensorRT-LLM，在配备RTX 30/40系列GPU显卡的台式机、笔记本上，只要显存不少于8GB，就可以更轻松地完成要求严苛的AI工作负载。

现在，Tensor RT-LLM for Windows可以通过全新的封装接口，与 OpenAI 广受欢迎的聊天 API 兼容，因此可以在本地直接运行各种相关应用，而不需要连接云端，有利于在 PC 上保留私人和专有数据，防范隐私泄露。

只要是针对TensorRT-LLM优化过的大语言模型，都可以与这一封装接口配合使用，包括Llama 2、Mistral、NV LLM，等等。

对于开发者来说，无需繁琐的代码重写和移植，只需修改一两行代码，就可以让AI应用在本地快速执行。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型 ↑↑↑基于TensorRT-LLM的微软Visual Studio代码插件——Continue.dev编码助手

本月底还会有TensorRT-LLM v0.6.0版本更新，将会在RTX GPU上带来多达5倍的推理性能提升，并支持更多热门的 LLM，包括全新的70亿参数Mistral、80亿参数Nemotron-3，让台式机和笔记本也能随时、快速、准确地本地运行LLM。

根据实测数据，RTX 4060显卡搭配TenroRT-LLM，推理性能可以跑到每秒319 tokens，相比其他后端的每秒61 tokens提速足足4.2倍。

RTX 4090则可以从每秒tokens加速到每秒829 tokens，提升幅度达2.8倍。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

基于强大的硬件性能、丰富的开发生态、广阔的应用场景，NVIDIA RTX正成为本地端侧AI不可或缺的得力助手，而越来越丰富的优化、模型和资源，也在加速AI功能、应用在上亿台RTX PC上的普及。

目前已经有400多个合作伙伴发布了支持RTX GPU加速的AI应用、游戏，而随着模型易用性的不断提高，相信会有越来越多的AIGC功能出现在Windows PC平台上。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

本文链接：http://www.28at.com/showinfo-24-27406-0.htmlNVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：牙膏都懒得挤了！RTX 40笔记本暂时按兵不动

下一篇：微软推出两款定制芯片Azure Maia 100和Azure Cobalt 100

标签：

热门焦点

石头自清洁扫拖机器人G10S评测：多年黑科技集大成之作懒人终极福音

科技圈经常能看到一个词叫“缝合怪”，用来形容那些把好多功能或者外观结合在一起的产品，通常这样的词是贬义词，但如果真的是产品缝合的好、缝合的实用的话，那它就成了中性词，今
6月iOS设备好评榜：第一蝉联榜首近一年

作为安兔兔各种榜单里变化最小的那个，2023年6月的iOS好评榜和上个月相比没有任何排名上的变化，仅仅是部分设备好评率的下降，长年累月的用户评价和逐渐退出市场的老款机器让这
三言两语说透柯里化和反柯里化

JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术，可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
疑似小米14外观设计图曝光：后置相机模组变化不大

下半年的大幕已经开启，而谁将成为下半年手机圈的主角就成为了大家关注的焦点，其中被传有望拿下新一代骁龙8 Gen3旗舰芯片的小米14系列更是备受大家瞩
四年持续更迭坚持探索行业无人之境，HarmonyOS 4带来五大升级多项创新

除了华为每年新发布的旗舰手机系列，上亿花粉更加期待鸿蒙系统每次的跨版本大更新。8月4日，HarmonyOS 4于HDC 2023正式发布，这也是该系统历经四年的再
华为Mate 60保护壳曝光：硕大后置相机模组凸起程度有惊喜

这段时间以来，关于华为新旗舰的爆料日渐密集。据此前多方爆料，今年华为将开始恢复一年双旗舰战略，除上半年推出的P60系列外，往年下半年的Mate系列也将
华为开发者大会2023日程公开：开设鸿蒙HarmonyOS 4体验区

IT之家 7 月 31 日消息，华为今日公布了 HDC.Together 开发者大会 2023 的详细日程。整场大会将于 8 月 4 日-6 日之间举行，届时将发布最新一代鸿蒙 H
半导体需求下滑三星电子DS业务部门今年营业亏损预计超10万亿韩元

7月17日消息，据外媒报道，去年下半年开始的半导体需求下滑，影响到了三星电子、SK海力士、英特尔等诸多厂商，营收明显下滑，部分厂商甚至出现了亏损。作为
机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

7月20日消息，据外媒报道，研究机构的报告显示，由于需求下滑，今年二季度全球智能手机的出货量，同比下滑了11%，三星、苹果等主要厂商的销量，较去年同期均有下

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

石头自清洁扫拖机器人G10S评测：多年黑科技集大成之作懒人终极福音

6月iOS设备好评榜：第一蝉联榜首近一年

三言两语说透柯里化和反柯里化

疑似小米14外观设计图曝光：后置相机模组变化不大

四年持续更迭坚持探索行业无人之境，HarmonyOS 4带来五大升级多项创新

华为Mate 60保护壳曝光：硕大后置相机模组凸起程度有惊喜

华为开发者大会2023日程公开：开设鸿蒙HarmonyOS 4体验区

半导体需求下滑三星电子DS业务部门今年营业亏损预计超10万亿韩元

机构称Q2全球智能手机出货量同比下滑11% 苹果份额依旧第2

最新推荐

猜你喜欢

热门推荐

相关资讯