当前位置:首页 > 元宇宙 > AI

Meta 开源 MobileLLM-R1 系列小语言 AI 模型:参数量不到 10 亿、专攻数学编程科学问题

来源: 责编: 时间:2025-09-25 15:01:00 56观看
导读 9 月 22 日消息,Meta 现已公布了 MobileLLM-R1 系列小语言模型,分别提供 1.4 亿、3.6 亿和 9.5 亿不同参数版本,强调能够在本地移动平台等轻量级设备上运行。Meta 表示,MobileLLM-R1 并不是面向聊天机器人的通用

9 月 22 日消息,Meta 现已公布了 MobileLLM-R1 系列小语言模型,分别提供 1.4 亿、3.6 亿和 9.5 亿不同参数版本,强调能够在本地移动平台等轻量级设备上运行。Eyq28资讯网——每日最新资讯28at.com

Eyq28资讯网——每日最新资讯28at.com

Meta 表示,MobileLLM-R1 并不是面向聊天机器人的通用模型,而是经过监督式微调(SFT)专门训练,主要用于解决数学、编程(如 Python、C++)和科学类问题,以最大规模的 MobileLLM-R1 950M 为例,其预训练数据仅使用了约 2TB 高质量 token,总训练数据量也不到 5TB,但表现依然出色。在 MATH、GSM8K、MMLU、LiveCodeBench 等多项基准测试中,成绩超过了使用 36TB token 数据训练的 Qwen 3-0.6B。Eyq28资讯网——每日最新资讯28at.com

在对比现有开源小模型时,MobileLLM-R1 950M 在 MATH 测试中的准确率是 Olmo 1.24B 的 5 倍,也是 SmolLM 1.7B 的 2 倍。在编程任务中,其表现同样优于 Olmo 1.24B 和 SmolLM 1.7B。Eyq28资讯网——每日最新资讯28at.com

目前,开发者可以通过 vLLM 推理引擎运行 MobileLLM-R1,只需在 ModelRegistry 中登记模型架构 Llama4ForCausalLM 即可。该系列模型已以 Apache 2.0 协议开源,并发布在 Hugging Face 平台(点此访问)。Eyq28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-28062-0.htmlMeta 开源 MobileLLM-R1 系列小语言 AI 模型:参数量不到 10 亿、专攻数学编程科学问题

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: DeepSeek 线上模型升级至 V3.1-Terminus 版本,改进语言一致性及 Agent 能力

下一篇: 宇树 G1 人形机器人遭“围殴”,摔倒后能快速起身

标签:
  • 热门焦点
  • 在元宇宙卖酸奶,这波联动燃爆了!

    来源:品牌头版 或许,每个人心中都住着一个小馋孩。可能是童年时百吃不厌,觉得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;还有可能,是某种不知为什么,就是很爱吃的
  • 这场虚拟人争夺战,互联网巨头下场先赢一半?

    撰文/ 孟会缘 近两年间,要论引得无数互联网巨头竞折腰的一大热门产业,莫过于元宇宙领域中的数字人了。 作为继数字藏品之后,开发元宇宙的又一重点落地项目,互联网
  • 挖来Meta AR高管,难道苹果也要进军元宇宙?

    “被曝光”的才是最吸引人的产品,相信有关注过苹果硬件消息的朋友们都明白这样的道理。往近了说有苹果“即将发布”的iPhone SE 3和M2芯片,往远了说有“折叠屏iP
  • Web3 去中心化身份管理系统的历史、现状与展望

    身份、数字资产和在线资料的映射最近在区块链行业获得了极大的关注。新技术正在形成架构,这将进一步为去中心化和以用户为中心的机制铺平道路。本文将讨论以下
  • 字节觅《原神》,腾讯元宇宙,游戏新王战旧神?

    文 | 陈桥辉陈奕迅的《红玫瑰》中有一句歌词,“得不到的永远在骚动”,这句话用到如今国内头部游戏平台再合适不过。随着《原神》的异军突起,使得头部游戏大厂感受
  • 元宇宙是推动NFT发展的初始家园

    现在大家都知道了什么是NFT,但好像离自己的生活还有一定距离。随着我们与NFT 接触增加,该如何将这些数字资产带入我们的日常生活?NFT还是主流吗?如果我们将“主流
  • 纽约街头出现NFT自动贩卖机

    一家初创公司宣布在纽约市开放一台NFT自动售货机,允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon,上个月完成了一轮300万美元的种子募捐
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
  • 76亿美金估值、2022年最具创新力公司,Dapper Labs如何做到?

    “元宇宙的开拓者”是我们针对元宇宙的发展而设立的专栏,主要面向那些深挖元宇宙产业或者在元宇宙进行“淘金”的从业者,分享这些企业或者创业者们的故事,以独特
Top