当前位置:首页 > 元宇宙 > AI

清华开源赤兔大模型推理引擎,国产芯片上DeepSeek推理成本减半性能翻倍

来源: 责编: 时间:2025-03-15 14:56:49 195观看
导读清华大学高性能计算研究所传来重要消息,翟季冬教授团队携手清华系科创先锋清程极智,共同宣布了一项重大开源成果——大模型推理引擎“赤兔 Chitu”。这款引擎开创性地实现了在非英伟达Hopper架构GPU及众多国产芯片上的F

清华大学高性能计算研究所传来重要消息,翟季冬教授团队携手清华系科创先锋清程极智,共同宣布了一项重大开源成果——大模型推理引擎“赤兔 Chitu”。4RG28资讯网——每日最新资讯28at.com

这款引擎开创性地实现了在非英伟达Hopper架构GPU及众多国产芯片上的FP8精度模型原生运行,显著降低了推理成本,性能更是实现了翻倍。据悉,赤兔引擎被精准定位为“生产级大模型推理引擎”,旨在为用户带来多重优势。4RG28资讯网——每日最新资讯28at.com

首先,赤兔引擎具备强大的多元算力适配能力。无论是NVIDIA的最新旗舰产品,还是旧款的多系列产品,亦或是国产芯片,赤兔引擎都能提供优化的支持,确保了广泛的兼容性。4RG28资讯网——每日最新资讯28at.com

其次,赤兔引擎全场景可伸缩的特性使其应用场景更加灵活。无论是纯CPU部署、单GPU部署,还是大规模集群部署,赤兔引擎都能提供可扩展的解决方案,满足不同场景下的需求。4RG28资讯网——每日最新资讯28at.com

赤兔引擎的长期稳定运行能力也是其一大亮点。在实际生产环境中,赤兔引擎的稳定性足以承载高并发的业务流量,确保了业务的连续性和稳定性。4RG28资讯网——每日最新资讯28at.com

在部署DeepSeek-R1-671B满血版时,赤兔引擎在A800集群的测试中展现出了卓越的性能。与部分国外开源框架相比,赤兔引擎在实现GPU使用量减少50%的同时,推理速度还提升了3.15倍,这一成绩无疑令人瞩目。4RG28资讯网——每日最新资讯28at.com

对于广大开发者和用户而言,赤兔引擎的开源无疑是一个巨大的福音。现在,大家可以通过访问GitHub上的开源地址(https://github.com/thu-pacman/chitu),轻松获取并体验这款强大的大模型推理引擎。4RG28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
雷军在小米的“多重身份”引网友热议,你心中的雷军是啥样?
雷军在小米的“多重身份”引网友热议,你心中的雷军是啥样?
新一代大众T-Roc探歌真面目泄露:MQB Evo平台+全新前脸设计曝光!
新一代大众T-Roc探歌真面目泄露:MQB Evo平台+全新前脸设计曝光!
小鹏汽车SUV双子星G6与G9:全系标配5C超充AI电池,开启智能新纪元
小鹏汽车SUV双子星G6与G9:全系标配5C超充AI电池,开启智能新纪元
日本氟离子电池技术突破,能否撼动中国新能源电池领先地位?
日本氟离子电池技术突破,能否撼动中国新能源电池领先地位?
燃油车韧性再现,艾瑞泽8 PRO以豪华智能重新定义燃油价值
燃油车韧性再现,艾瑞泽8 PRO以豪华智能重新定义燃油价值
小米YU7纯电车型亮相:三种续航选择,6月上市在即!
小米YU7纯电车型亮相:三种续航选择,6月上市在即!
热门内容
  • 夸克AI搜索升级“深度思考”,纯净浏览器迎来智能新篇章!
  • 浙大发布“浙大先生”,深度融合智能体DeepSeek V3/R1全国高校共享!
  • 00后主播借AI工具DeepSeek,直播单日狂揽3.3亿销售额!
  • 夸克AI搜索升级“深度思考”,阿里自研模型加持,DeepSeek暂缺席
  • 微信生活服务添新成员,元宝App下载入口限时开放
  • 微信接入AI新模型,腾讯股价暴涨近3000亿!
  • 中国AI新突破!全球首款通用Agent产品Manus内测引热议
  • 华为发布DeepSeek超融合一体机,全面适配V3&R1及蒸馏模型,加速AI应用
  • AI大模型时代,文科生将何去何从?
  • 马斯克xAI发布Grok-3,杭州才子吴宇怀领衔创始团队亮相
  • 浙大AI团队开播DeepSeek系列公开课,每周五晚相约云端探秘
  • 百度PC端DeepSeek入口上线,1小时破千万用户尝鲜AI搜索新体验!
  • 悟空浏览器牵手DeepSeek R1,抖音内容生态将迎新变化?
  • 阿里新夸克AI超级框上线,能否撼动腾讯元宝的AI入口地位?
  • 夸克AI搜索新增“深度思考”,纯净浏览器变身智能提效神器!
本栏最新
阿里达摩院技术大牛鄢志杰离职,语音技术领域或将迎来新变局?
阿里达摩院技术大牛鄢志杰离职,语音技术领域或将迎来新变局?
AI虚拟人时代:Meta与微美全息共绘数字人高效生成新篇章
AI虚拟人时代:Meta与微美全息共绘数字人高效生成新篇章
华硕a豆14 Air悦享版评测:轻薄高颜值,AI加持生产力爆棚
华硕a豆14 Air悦享版评测:轻薄高颜值,AI加持生产力爆棚
AI梦工厂!伯克利一实验室孵化15位创业者,华人力量闪耀大模型机器人搜索领域
AI梦工厂!伯克利一实验室孵化15位创业者,华人力量闪耀大模型机器人搜索领域
优必选联手国家队,天工行者29.9万重塑全尺寸科研人形机器人市场格局
优必选联手国家队,天工行者29.9万重塑全尺寸科研人形机器人市场格局
本周AI大事件:绿洲入口开启,智能体、图像生成突破不断!
本周AI大事件:绿洲入口开启,智能体、图像生成突破不断!

本文链接:http://www.28at.com/showinfo-45-11507-0.html清华开源赤兔大模型推理引擎,国产芯片上DeepSeek推理成本减半性能翻倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 神策数据携手DeepSeek,AI如何重塑数据分析与智能运营新生态?

下一篇: 阿里达摩院技术大牛鄢志杰离职,语音技术领域或将迎来新变局?

标签:
  • 热门焦点
  • 数字人的AB面:在元宇宙中过气,在AIGC中重生

    来源:光锥智能作者:郝 鑫“29800元一年的虚拟主播,号称24小时不停播,月入十几万,实际上却是关键词都不能回复,播了半个月,直播间还因违规被快手封禁,最终投诉无门、退款无果。&
  • 聚焦虚拟数字人技术,这三大商机要抓住!

    关于虚拟数字人,企业可以从三个方面入局,分别是ToG(To Government,面向政府),即为数字政府和数字城市提供支持服务;ToB(To Business,面向企业),即为企业提供虚拟员工解决方案;ToC(To Cons
  • 韩国主权基金增加对硅谷初创公司投资 押注元宇宙和人工智能

    韩国投资公司(KIC)CEO Seoungho Jin预计,该公司在旧金山的办事处今年将扩招人手,探索在硅谷投资科技、健康和绿色项目。规模高达2000亿美元的韩国主权财富基金—
  • 2022 区块链 50 强榜单;垃圾NFT项目的十三个特性

    本期关键字TerraZero在Decentraland完成元宇宙住房抵押贷款;腾讯发行齐白石画作数字藏品;Ripple成为数字欧元协会成员;Gem上线稀有度排名功能;2022 区块链 50 强榜
  • NFT的未来:传统企业与去中心化机构之间的竞赛

    传统企业和去中心化机构一直存在分歧,但最近NFT的爆炸式增长让他们产生了共同的兴趣,双方都在竞相让用户更轻松、更方便地使用NFT。毫无疑问,NFT 市场正在增长。
  • 以太坊升级将会带来的5个改变

    以太坊自2015年诞生以来就广受欢迎,但最近其昂贵的交易费用和低可扩展性对执行复杂的应用程序产生了负面作用,用户对以太坊改进的需求也日益急迫。以太坊2.0已进
  • NFT艺术家Hayley Rincon 专访:我的迷幻数字艺术之路

    Hayley Rincon是一位令人印象深刻才华横溢的创作者,她的作品呈现出迷幻的气息。今天就来聊聊她的艺术作品,和她自己的数字艺术之路。Hayley是加利福尼亚湾区的有
  • NFT世界的艺术家名单

    我们汇编了以下艺术家的名单,它包括每个艺术家的简短概述。当然,这份名单肯定不全面,还有很多很多艺术家、哲学家和商业领袖为世界贡献了不可估量的价值。而他们
  • 参加元宇宙里的招聘会是什么样一种体验?

    求职者可以在活动中走动,就像他们在现实生活中一样。长话短说看亮点:招聘公司Hirect为Y-combinator支持的初创公司举办了一场元宇宙招聘会。这里有一个大厅、一

最新推荐

猜你喜欢

热门推荐

相关资讯

Top