当前位置:首页 > 科技  > 手机

IBM预览Granite 4.0 Tiny:12GB显卡驱动5会话,高效低耗引领新潮流

来源: 责编: 时间:2025-05-11 10:26:55 268观看
导读IBM近期揭晓了其Granite 4.0系列中的一款迷你版模型——Granite 4.0 Tiny预览版的细节。这款模型在5月2日进行了介绍,是Granite系列中的小型版本之一。Granite 4.0 Tiny Preview以其卓越的计算效率和极低的内存需求脱

IBM近期揭晓了其Granite 4.0系列中的一款迷你版模型——Granite 4.0 Tiny预览版的细节。这款模型在5月2日进行了介绍,是Granite系列中的小型版本之一。Ydd28资讯网——每日最新资讯28at.com

Granite 4.0 Tiny Preview以其卓越的计算效率和极低的内存需求脱颖而出。在FP8精度下,它仅需12GB显存便能同时运行5个128KB上下文窗口的对话。这样强大的性能只需一张英伟达GeForce RTX 3060 12GB显卡便能实现,该显卡的建议零售价为329美元(约2383元人民币)。Ydd28资讯网——每日最新资讯28at.com

尽管目前预览版仅训练了2.5T的Token数,但其性能已能与训练了12T Token的Granite 3.3 2B Instruct相媲美。更令人惊讶的是,在128KB上下文窗口下支持16个并发会话时,其内存需求降低了约72%。据IBM透露,最终版本的Granite 4.0 Tiny预计性能将达到甚至超越Granite 3.3 8B Instruct的水平。Ydd28资讯网——每日最新资讯28at.com

Ydd28资讯网——每日最新资讯28at.com

Granite 4.0 Tiny Preview的总参数规模为70亿,但实际参与计算的活跃参数仅为10亿。它基于Granite 4.0系列全线采用的混合Mamba-2/Transformer架构,这种架构结合了速度与精度,有效降低了内存消耗,同时保持了出色的性能。Ydd28资讯网——每日最新资讯28at.com

目前,Granite 4.0 Tiny预览版已在Hugging Face平台上以标准的Apache 2.0许可证开放获取。IBM计划在今年夏天正式发布Granite 4.0系列的Tiny、Small和Medium版本,为用户带来更多选择。Ydd28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-149084-0.htmlIBM预览Granite 4.0 Tiny:12GB显卡驱动5会话,高效低耗引领新潮流

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 雷诺Boreal SUV原型车路测曝光,设计源自Dacia Bigster引关注

下一篇: 5月9日短剧付费热度盘点,《锦鲤萌宝闹京都》领跑,大盘热度破五千六百万

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 6月iOS设备好评榜:第一蝉联榜首近一年

    作为安兔兔各种榜单里变化最小的那个,2023年6月的iOS好评榜和上个月相比没有任何排名上的变化,仅仅是部分设备好评率的下降,长年累月的用户评价和逐渐退出市场的老款机器让这
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • 十个可以手动编写的 JavaScript 数组 API

    JavaScript 中有很多API,使用得当,会很方便,省力不少。 你知道它的原理吗? 今天这篇文章,我们将对它们进行一次小总结。现在开始吧。1.forEach()forEach()用于遍历数组接收一参
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • 掘力计划第 20 期:Flutter 混合开发的混乱之治

    在掘力计划系列活动第20场,《Flutter 开发实战详解》作者,掘金优秀作者,Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • AI芯片初创公司Tenstorrent获三星和现代1亿美元投资

    Tenstorrent是一家由芯片行业资深人士Jim Keller领导的加拿大初创公司,专注于开发人工智能芯片,该公司周三表示,已经从现代汽车集团和三星投资基金等
  • 质感不错!OPPO K11渲染图曝光:旗舰IMX890传感器首次下放

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
Top