当前位置:首页 > 科技  > 芯片

S-LoRA技术:减轻企业LLM部署负担

来源: 责编: 时间:2023-12-06 09:20:13 432观看
导读随着人工智能的快速发展,大型语言模型(LLM)在商业领域的应用越来越广泛。然而,传统的微调方法往往需要耗费大量的运算资源和成本,这对于资源有限的企业来说是一个巨大的阻碍。为了解决这个问题,史丹佛大学和加州大学柏克莱

随着人工智能的快速发展,大型语言模型(LLM)在商业领域的应用越来越广泛。然而,传统的微调方法往往需要耗费大量的运算资源和成本,这对于资源有限的企业来说是一个巨大的阻碍。w5O28资讯网——每日最新资讯28at.com


w5O28资讯网——每日最新资讯28at.com

为了解决这个问题,史丹佛大学和加州大学柏克莱分校(UC Berkeley)的研究团队共同开发了一种名为S-LoRA的创新技术,该技术可以大幅降低微调LLM的成本,让企业能够在单一图形处理单元(GPU)上运行数百个甚至数千个模型。w5O28资讯网——每日最新资讯28at.com


w5O28资讯网——每日最新资讯28at.com

传统上,微调LLM需要使用新的范例,重新训练预训练模型并调整所有参数。然而,LLM通常拥有数十亿个参数,因此需要大量的运算资源。S-LoRA技术通过参数高效微调法(PEFT)解决了这个问题。w5O28资讯网——每日最新资讯28at.com


w5O28资讯网——每日最新资讯28at.com

LoRA是一种由微软开发的低端适应款模型,它可以降低可训练参数的数量,同时维持准确度,从而大幅减少定制化模型所需的存储器和运算资源。S-LoRA则拥有动态存储器管理系统,可以在主存储器(RAM)和GPU之间灵活切换LoRA适配器。w5O28资讯网——每日最新资讯28at.com


w5O28资讯网——每日最新资讯28at.com

S-LoRA系统还引入了“统一分页”(Unified Paging),让服务器能够处理数百个甚至数千个批量的查询,而不会出现存储器碎片化问题。此外,S-LoRA还整合了“张量平行系统”(Tensor parallelism)。w5O28资讯网——每日最新资讯28at.com


w5O28资讯网——每日最新资讯28at.com

这些特点使得S-LoRA能够在单一GPU或多个GPU上服务许多LoRA适配器。最显著的成就是,S-LoRA能够同时服务2,000个适配器。w5O28资讯网——每日最新资讯28at.com


w5O28资讯网——每日最新资讯28at.com

目前,S-LoRA的程序码已经公布在GitHub上。研究人员计划将其整合到当今流行的LLM服务架构中,这样企业就可以轻松地将S-LoRA融入自家应用程序,以最小的成本享受定制化的LLM驱动服务。w5O28资讯网——每日最新资讯28at.com


w5O28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-27-38475-0.htmlS-LoRA技术:减轻企业LLM部署负担

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 索尼计划为PlayStation Portal增加云端串流功能

下一篇: 罗姆与Quanmatic公司利用量子技术优化制造工序并完成验证

标签:
  • 热门焦点
  • 服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 一年经验在二线城市面试后端的经验分享

    忠告这篇文章只适合2年内工作经验、甚至没有工作经验的朋友阅读。如果你是2年以上工作经验,请果断划走,对你没啥帮助~主人公这篇文章内容来自 「升职加薪」星球星友 的投稿,坐
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 年轻人的“职场羞耻感”,无处不在

    作者:冯晓亭 陶 淘 李 欣 张 琳 马舒叶来源:燃次元“人在职场,应该选择什么样的着装?”近日,在网络上,一个与着装相关的帖子引发关注,在该帖子里,一位在高级写字楼亚洲金
  • 苹果、三星、惠普等暂停向印度出口笔记本和平板电脑

    集微网消息,据彭博社报道,在8月3日印度突然禁止在没有许可证的情况下向印度进口电脑/平板及显示器等产品后,苹果、三星电子和惠普等大公司暂停向印度
  • 联想小新Pad Pro 12.6将要推出,搭载高通骁龙 870 处理器

    联想小新Pad Pro 12.6将于秋季新品会上推出,官方按照惯例直接在发布会前给出了机型的所有参数。联想小新 Pad Pro 12.6 将搭载高通骁龙 870 处理器,重量为 5
  • 由于成本持续增加,笔记本产品价格预计将明显上涨

    根据知情人士透露,由于材料、物流等成本持续增加,笔记本产品价格预计将在2021年下半年有明显上涨。进入6月下旬以来,全球半导体芯片缺货情况加剧,显卡、处理器
  • 电博会上海尔智家模拟500平大平层,还原生活空间沉浸式体验

    电博会为了更好地让参展观众真正感受到智能家居的绝妙之处,海尔智家的程传岭先生同样介绍了展会上海尔智家的模拟500平大平层,还原生活空间沉浸式体验。程传
Top