当前位置:首页 > 科技  > 数码

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

来源: 责编: 时间:2024-10-01 17:06:37 162观看
导读 快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。AMD-135小模

快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。vpg28资讯网——每日最新资讯28at.com

相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。vpg28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍vpg28资讯网——每日最新资讯28at.com

AMD-135小模型隶属于Llama家族,有两个版本:vpg28资讯网——每日最新资讯28at.com

一是基础型“AMD-Llama-135M”,拥有多达6700亿个token,在八块Instinct MIM250 64GB加速器上训练了六天。vpg28资讯网——每日最新资讯28at.com

二是延伸型“AMD-Llama-135M-code”,额外增加了专门针对编程的200亿个token,同样硬件训练了四天。vpg28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍创建与部署流程vpg28资讯网——每日最新资讯28at.com

它使用了一种名为“推测解码”(speculative decoding)的方法,通过较小的草稿模型,在单次前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型,进行验证或纠正。vpg28资讯网——每日最新资讯28at.com

这种方法可以同时生成多个token,不会影响性能,还可以降低内存占用,但因为数据交易更多,功耗也会增加。vpg28资讯网——每日最新资讯28at.com

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型,测试了推测解码使用与否的性能。vpg28资讯网——每日最新资讯28at.com

比如在MI250加速器上,性能可提升多约2.8倍,锐龙AI CPU上可提升多约3.88倍,锐龙AI NPU上可提升多约2.98倍。vpg28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍推测解码vpg28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍vpg28资讯网——每日最新资讯28at.com

AMD-135M小模型的训练代码、数据集等资源都已经开源,遵循Apache 2.0。vpg28资讯网——每日最新资讯28at.com

按照AMD的说法,它的性能与其他开源小模型基本相当或略有领先,比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。vpg28资讯网——每日最新资讯28at.com

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍vpg28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-117283-0.htmlAMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 首款真正全白主板!技嘉X870E AORUS PRO ICE电竞冰雕首发评测:性能超上代旗舰

下一篇: 内存优化当下强!微星 MPG X870E CARBON WIFI暗黑板主板评测:游戏性能大幅强于顶级X670E

标签:
  • 热门焦点
  • vivo TWS Air开箱体验:真轻 臻好听

    在vivo S15系列新机的发布会上,vivo的最新款真无线蓝牙耳机vivo TWS Air也一同发布,本次就这款耳机新品给大家带来一个简单的分享。外包装盒上,vivo TWS Air保持了vivo自家产
  • 7月安卓手机性能榜:红魔8S Pro再夺榜首

    7月份的手机市场风平浪静,除了红魔和努比亚带来了两款搭载骁龙8Gen2领先版处理器的新机之外,别的也想不到有什么新品了,这也正常,通常6月7月都是手机厂商修整的时间,进入8月份之
  • 一加首款折叠屏!一加Open渲染图出炉:罕见单手可握小尺寸

    8月5日消息,此前就有爆料称,一加首款折叠屏手机将会在第三季度上市,如今随着时间临近,新机的各种消息也开始浮出水面。据悉,这款新机将会被命名为“On
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 慕岩炮轰抖音,百合网今何在?

    来源:价值研究所 作者:Hernanderz“难道就因为自己的一个产品牛逼了,从客服到总裁,都不愿意正视自己产品和运营上的问题,选择逃避了吗?”这一番话,出自百合网联合创
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 华为Mate60标准版细节曝光:经典星环相机模组回归

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • iQOO Neo8 Pro评测:旗舰双芯加持 最强性能游戏旗舰

    【Techweb评测】去年10月,iQOO推出了一款Neo7手机,该机搭载了联发科天玑9000+,配备独显芯片Pro+,带来了同价位段最佳的游戏体验,一经上市便受到了诸多用
Top