当前位置:首页 > 科技  > 软件

清华开源赤兔大模型推理引擎,国产芯片上DeepSeek推理成本减半性能翻倍

来源: 责编: 时间:2025-03-15 14:54:42 163观看
导读清华大学高性能计算研究所传来重要消息,翟季冬教授团队携手清华系科创先锋清程极智,共同宣布了一项重大开源成果——大模型推理引擎“赤兔 Chitu”。这款引擎开创性地实现了在非英伟达Hopper架构GPU及众多国产芯片上的F

清华大学高性能计算研究所传来重要消息,翟季冬教授团队携手清华系科创先锋清程极智,共同宣布了一项重大开源成果——大模型推理引擎“赤兔 Chitu”。Kzh28资讯网——每日最新资讯28at.com

这款引擎开创性地实现了在非英伟达Hopper架构GPU及众多国产芯片上的FP8精度模型原生运行,显著降低了推理成本,性能更是实现了翻倍。据悉,赤兔引擎被精准定位为“生产级大模型推理引擎”,旨在为用户带来多重优势。Kzh28资讯网——每日最新资讯28at.com

首先,赤兔引擎具备强大的多元算力适配能力。无论是NVIDIA的最新旗舰产品,还是旧款的多系列产品,亦或是国产芯片,赤兔引擎都能提供优化的支持,确保了广泛的兼容性。Kzh28资讯网——每日最新资讯28at.com

其次,赤兔引擎全场景可伸缩的特性使其应用场景更加灵活。无论是纯CPU部署、单GPU部署,还是大规模集群部署,赤兔引擎都能提供可扩展的解决方案,满足不同场景下的需求。Kzh28资讯网——每日最新资讯28at.com

赤兔引擎的长期稳定运行能力也是其一大亮点。在实际生产环境中,赤兔引擎的稳定性足以承载高并发的业务流量,确保了业务的连续性和稳定性。Kzh28资讯网——每日最新资讯28at.com

在部署DeepSeek-R1-671B满血版时,赤兔引擎在A800集群的测试中展现出了卓越的性能。与部分国外开源框架相比,赤兔引擎在实现GPU使用量减少50%的同时,推理速度还提升了3.15倍,这一成绩无疑令人瞩目。Kzh28资讯网——每日最新资讯28at.com

对于广大开发者和用户而言,赤兔引擎的开源无疑是一个巨大的福音。现在,大家可以通过访问GitHub上的开源地址(https://github.com/thu-pacman/chitu),轻松获取并体验这款强大的大模型推理引擎。Kzh28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-136913-0.html清华开源赤兔大模型推理引擎,国产芯片上DeepSeek推理成本减半性能翻倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 奇瑞星纪元ET纯电版SUV焕新上市,3月18日见证科技新飞跃!

下一篇: A17 Pro芯片揭秘:存在两版本,新版发热功耗问题得改善?

标签:
  • 热门焦点
  • 鸿蒙OS 4.0公测机型公布:甚至连nova6都支持

    华为全新的HarmonyOS 4.0操作系统将于今天下午正式登场,官方在发布会之前也已经正式给出了可升级的机型产品,这意味着这些机型会率先支持升级享用。这次的HarmonyOS 4.0支持
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • Temu起诉SHEIN,跨境电商战事升级

    来源 | 伯虎财经(bohuFN)作者 | 陈平安日前据外媒报道,拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼,诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
  • 消息称小米汽车开始筛选交付中心:需至少120个车位

    IT之家 7 月 7 日消息,日前,有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者 发文表示,据经销商集团反馈,小米汽车目前
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
  • 苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
Top