当前位置：首页 > 元宇宙 > AI

非 Transformer 架构 AI 模型 Liquid 问世，号称性能“凌驾 Meta Llama 微软 Phi”

来源：责编：时间：2024-10-05 19:24:56 197观看

导读 10 月 2 日消息，去年刚成立的 Liquid AI 公司于 9 月 30 日发布了三款 Liquid 基础模型（Liquid Foundation Models，LFM），分别为 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。这些模型均采用非 Transformer 架构，号称在基准测

10 月 2 日消息，去年刚成立的 Liquid AI 公司于 9 月 30 日发布了三款 Liquid 基础模型（Liquid Foundation Models，LFM），分别为 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。这些模型均采用非 Transformer 架构，号称在基准测试中凌驾同规模的 Transformer 模型。

注意到，目前业界在深度学习和自然语言处理方面主要使用 Transformer架构，该架构主要利用自注意力机制捕捉序列中单词之间的关系，包括 OpenAI 的 GPT、Meta 的 BART 和谷歌的 T5 等模型，都是基于 Transformer 架构。

而Liquid AI 则反其道而行之，其 Liquid 基础模型号称对模型架构进行了“重新设想”，据称受到了“交通信号处理系统、数值线性代数”理念的深刻影响，主打“通用性”，能够针对特定类型的数据进行建模，同时支持对视频、音频、文本、时间序列和交通信号等内容进行处理。

Liquid AI 表示，与 Transformer 架构模型相比 LFM 模型的RAM用量更少，特别是在处理大量输入内容场景时，由于 Transformer 架构模型处理长输入时需要保存键值（KV）缓存，且缓存会随着序列长度的增加而增大，导致输入越长，占用的RAM越多。

而 LFM 模型则能够避免上述问题，系列模型能够有效对外界输入的数据进行压缩，降低对硬件资源的需求，在相同硬件条件下，这三款模型相对业界竞品能够处理更长的序列。

参考 Liquid AI 首批发布的三款模型，其中 LFM-1.3B 专为资源受限的环境设计，而 LFM-3.1B 针对边缘计算进行了优化，LFM-40.3B 则是一款“专家混合模型（MoE）”，该版本主要适用于数学计算、交通信号处理等场景。

这些模型在通用知识和专业知识的处理上表现较为突出，能够高效处理长文本任务，还能够处理数学和逻辑推理任务，目前该模型主要支持英语，不过也对中文、法语、德语、西班牙语、日语、韩语和阿拉伯语提供有限支持。

根据 Liquid AI 的说法，LFM-1.3B 在许多基准测试中击败了其他 1B 参数规模的领先模型，包括苹果的 OpenELM、Meta 的 Llama 3.2、微软的 Phi 1.5 以及 Stability 的 Stable LM 2，这标志着首次有非 GPT 架构的模型明显超越了 Transformer 模型。

而在 LFM-3.1B 方面，这款模型不仅能够超越了 3B 规模的各种 Transformer 模型、混合模型和 RNN 模型，甚至还在特定场景超越上一代的 7B 和 13B 规模模型，目前已战胜谷歌的 Gemma 2、苹果的 AFM Edge、Meta 的 Llama 3.2 和微软的 Phi-3.5 等。

LFM-40.3B 则强调在模型规模和输出质量之间的平衡，不过这款模型有所限制，虽然其拥有 400 亿个参数，但在推理时仅启用 120 亿个参数，Liquid AI 声称进行相关限制是因为模型出品质量已经足够，在这种情况下对相应参数进行限制“反而还能够提升模型效率、降低模型运行所需的硬件配置”。

本文链接：http://www.28at.com/showinfo-45-8028-0.html非 Transformer 架构 AI 模型 Liquid 问世，号称性能“凌驾 Meta Llama 微软 Phi”

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： PyTorch 架构优化库 torchao 正式发布，可大幅提升 AI 模型效率

下一篇： OpenAI 引领 AI 浪潮：o1 模型可处理 5 小时任务，颠覆营销思维和模式

标签：

热门焦点

AI大模型“战火”烧到了教育领域

作者：刘旷自2023年开年以来，AI大模型这股风是越吹越猛烈了。随着ChatGPT的出圈爆火，再度掀起了一波AI热浪，无论是在国内还是国外都有不少企业宣布入局或者跟进AI大模型领域。与
数字人的新革命，BAT的“冲高”战场

来源：刘旷ChatGPT横空出世，让人们看到了数字人的另一种可能，将ChatGPT与虚拟数字人融合，研发出更加智能化、拟人化的虚拟数字人成为数字人厂商的新命题、新方向。2月份，岭南股份
文心一言排名垫底，却成为百度业绩增长杠杆

文/侯煜编辑/罗卿知识增强大预言模式文心一言发布后，百度公司热度大幅提升，文心一言到底能为百度的业绩带来多大的增益成为业内关注焦点。近日，百度（NASDAQ：BIDU/09888.HK）公布了
“任何国产元宇宙都是假元宇宙”

上个月，华语乐坛的优质偶像之一，DOTA2资深玩家林俊杰，在国外元宇宙产品分布式大陆(Decentraland)上买了三块虚拟地产，花了12.3万美元（也就是人民币接近80万）。截至目
字节跳动，刚刚投了一位虚拟女生

今年第一笔虚拟人融资出炉了。投资界获悉，杭州李未可科技有限公司显示发生股东变更，新增字节跳动关联公司北京量子跃动科技有限公司。今天公司方面正式确认，本轮
传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

今日热点：传腾讯已推出全新XR业务；摩托罗拉与Verizon合作打造5G XR颈戴式计算组件；小米AR购物导航专利获授权；VR一体机Simula One放弃众筹并开放直接预订；VR游戏《
多地释放积极信号，元宇宙正成为地方争先竞逐的主战场？

2月21日，2022中国·金鱼嘴元宇宙生态赋能大会在南京建邺区金鱼嘴基金街区举办，南京建邺区金鱼嘴基金街区宣布计划出资1亿元，支持元宇宙行业发展。同时，会上发布了
元宇宙风归何处？

元宇宙持续大火，在过去一段时间内，其屡次登上热点，吸引了一波又一波投资者。近期，在“2022中国·金鱼嘴元宇宙生态赋能大会”上，南京建邺区金鱼嘴基金街区宣布计划
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

非 Transformer 架构 AI 模型 Liquid 问世，号称性能“凌驾 Meta Llama 微软 Phi”

AI大模型“战火”烧到了教育领域

数字人的新革命，BAT的“冲高”战场

文心一言排名垫底，却成为百度业绩增长杠杆

“任何国产元宇宙都是假元宇宙”

字节跳动，刚刚投了一位虚拟女生

传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

多地释放积极信号，元宇宙正成为地方争先竞逐的主战场？

元宇宙风归何处？

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

最新推荐

这场虚拟人争夺战，互联网巨头下场先赢一半？

中文在线的“元宇宙”故事，资本听腻了？

2021年中国智慧城市行业概览：AI慧眼独具，赋能“双碳”目标

如何在元宇宙中建立品牌忠诚度

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

元宇宙的应用行业研究：娱乐可能是元宇宙落地最快的场景之一

猜你喜欢

热门推荐

相关资讯