当前位置:首页 > 元宇宙 > AI

美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出

来源: 责编: 时间:2025-09-03 16:52:02 55观看
导读 9 月 1 日消息,美团今日正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数 560B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。

9 月 1 日消息,美团今日正式发布 LongCat-Flash-Chat,并同步开源。hZH28资讯网——每日最新资讯28at.com

hZH28资讯网——每日最新资讯28at.com

LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数 560B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。hZH28资讯网——每日最新资讯28at.com

LongCat-Flash 模型在架构层面引入“零计算专家(Zero-Computation Experts)”机制,总参数量 560B,每个 token 依据上下文需求仅激活 18.6B~31.3 B 参数,实现算力按需分配和高效利用。为控制总算力消耗,训练过程采用 PID 控制器实时微调专家偏置,将单 token 平均激活量稳定在约 27B。hZH28资讯网——每日最新资讯28at.com

hZH28资讯网——每日最新资讯28at.com

▲ LongCat-Flash 架构图

此外,LongCat-Flash 在层间铺设跨层通道,使 MoE 的通信和计算能很大程度上并行,提高了训练和推理效率。配合定制化的底层优化,LongCat-Flash 在 30 天内完成训练,并在 H800 上实现单用户 100+ tokens / s 的推理速度。LongCat-Flash 还对常用大模型组件和训练方式进行了改进,使用了超参迁移和模型层叠加的方式进行训练,并结合了多项策略保证训练稳定性。hZH28资讯网——每日最新资讯28at.com

针对智能体(Agentic)能力,LongCat-Flash 自建了 Agentic 评测集指导数据策略,并在训练全流程进行了全面的优化,包括使用多智能体方法生成多样化高质量的轨迹数据等,实现了更好的智能体能力。hZH28资讯网——每日最新资讯28at.com

通过算法和工程层面的联合设计,LongCat-Flash 在理论上的成本和速度都大幅领先行业同等规模、甚至规模更小的模型;通过系统优化,LongCat-Flash 在 H800 上达成了 100 tokens / s 的生成速度,在保持极致生成速度的同时,输出成本低至 5 元 / 百万 token。hZH28资讯网——每日最新资讯28at.com

根据多项基准测试综合评估,作为一款非思考型基础模型,LongCat-Flash-Chat 在仅激活少量参数的前提下,性能比肩当下领先的主流模型,尤其在智能体任务中具备突出优势。并且,因为面向推理效率的设计和创新,LongCat-Flash-Chat 具有明显更快的推理速度,更适合于耗时较长的复杂智能体应用。hZH28资讯网——每日最新资讯28at.com

在通用领域知识方面,LongCat-Flash 在 ArenaHard-V2 基准测试中取得 86.50 的成绩,位列所有评估模型中的第二名。在基础基准测试中,MMLU(多任务语言理解基准)得分为 89.71,CEval(中文通用能力评估基准)得分为 90.44。这些成绩可与目前国内领先的模型比肩,且其参数规模少于 DeepSeek-V3.1、Kimi-K2 等产品。hZH28资讯网——每日最新资讯28at.com

在智能体(Agentic)工具使用方面,LongCat-Flash 展现出明显优势:即便与参数规模更大的模型相比,其在 τ2-Bench(智能体工具使用基准)中的表现仍超越其他模型;在高复杂度场景下,该模型在 VitaBench(复杂场景智能体基准)中以 24.30 的得分位列第一。hZH28资讯网——每日最新资讯28at.com

在编程方面,LongCat-Flash 在 TerminalBench(终端命令行任务基准)中,以 39.51 的得分位列第二;在 SWE-Bench-Verified(软件工程师能力验证基准)中得分为 60.4。hZH28资讯网——每日最新资讯28at.com

在指令遵循方面,LongCat-Flash 在 IFEval(指令遵循评估基准)中以 89.65 的得分位列第一;此外,在 COLLIE(中文指令遵循基准)和 Meeseeks-zh(中文多场景指令基准)中也斩获最佳成绩,分别为 57.10 和 43.03,凸显其在中英文两类不同语言、不同高难度指令集上的驾驭能力。hZH28资讯网——每日最新资讯28at.com

hZH28资讯网——每日最新资讯28at.com

目前,LongCat-Flash-Chat 在 Github、Hugging Face 平台同步开源。附开源地址:hZH28资讯网——每日最新资讯28at.com

Hugging Face:https://huggingface.co/meituan-longcat/LongCat-Flash-ChathZH28资讯网——每日最新资讯28at.com

Github:https://github.com/meituan-longcat/LongCat-Flash-ChathZH28资讯网——每日最新资讯28at.com

体验官网:https://longcat.ai/hZH28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-27231-0.html美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 北京中小学校新学期开展人工智能通识教育,每学年不少于 8 课时

下一篇: 9 月起影响你我生活的新规:电动自行车“新国标”、AI 生成内容必须添加标识等

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 25万虚拟er在“元宇宙”追星

    “默叽默叽,我是默默酱,我是在真元宇宙也有头有脸的人。”12月11日晚20:00,虚拟偶像@默默酱的首场个人元宇宙演唱会《以梦为马,抵达繁星》在大有空间APP
  • 现在的元宇宙:一款低配版的科幻游戏

    在2021年的岁末之际,不禁感叹元宇宙元年之热闹,从元宇宙NFT头像,到元宇宙数字地产,再到元宇宙旅游景区等等,仿佛科幻感十足的元宇宙眨眼间就从人们的概念认知中完全
  • 好莱坞:一股新的电影制作加密浪潮将颠覆这个行业

    在Moviecoin.com平台上,有一部电影设定了一个前所未有的目标,即通过预售NFT获得100%的全额融资,这部电影就是马克·奥康纳(Mark O’connor)执导的《Oui Cannes》,
  • 全面拥抱“虚拟世界”,摩登天空要打造“音乐元宇宙”

    作者:袁佳琦沈黎晖不怎么打游戏,但许多事儿在他眼里都“有意思”。好玩,有意思,是他的口头禅,在接受娱乐独角兽的采访过程中,他多次提到,做虚拟音乐人,“是件挺好玩的
  • Web 3如何改变传统HR

    互联网自诞生以来,经历了三次迭代。Web1是第一阶段,包括ISP服务器上的个人网页或免费的虚拟主机服务。然后Web2出现了,它引入了动态的用户生成内容、互操作性、增
  • 元宇宙需要的5个重要安全功能

    元宇宙的可能用途使其成为一个令人难以置信的概念,但是,就像科技界的任何事物一样,需要做一些事情来控制其使用。元宇宙的安全功能需要仔细考虑和开发,以保护用户
  • 利用元宇宙平台10天收入160万,风口还是虎口?

    美国Meta平台有限公司,也就是原来的脸书公司,9日宣布,公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象
  • 超级账本Julian Gordon:联盟链与公链的竞争不是非此即彼

    在2021年《福布斯》区块链50强榜单中,29家企业使用Hyperledger超级账本技术,占比近60%。同年,研究机构Blockdata发布了的调查报告显示,访问Top100上市公司中,有 81

猜你喜欢

    SQL Error: select * from ***_ecms_news13 where id in(179,225,206,,214,165) limit 6
Top