当前位置:首页 > 科技  > 软件

小米发布MoE大模型MiMo-V2-Flash,性能媲美顶尖模型,多项实测表现亮眼

来源: 责编: 时间:2025-12-18 12:45:42 46观看
导读小米今日正式发布并开源了最新一代MoE架构大模型MiMo-V2-Flash,该模型总参数规模达3090亿,激活参数150亿,在推理、编码及智能体应用场景中展现出显著优势。模型支持混合思维模式,用户可自由切换深度思考与即时响应模式,并

小米今日正式发布并开源了最新一代MoE架构大模型MiMo-V2-Flash,该模型总参数规模达3090亿,激活参数150亿,在推理、编码及智能体应用场景中展现出显著优势。模型支持混合思维模式,用户可自由切换深度思考与即时响应模式,并具备一键生成完整HTML网页的能力,可与Claude Code、Cursor等主流编码框架无缝协作。sT428资讯网——每日最新资讯28at.com

在性能测试中,MiMo-V2-Flash与DeepSeek-V3.2形成直接竞争态势。基准数据显示,该模型在数学竞赛AIME 2025和科学知识GPQA-Diamond测试中位列开源模型前二,软件工程能力SWE验证及多语言测试中更超越所有开源竞品,性能表现与全球顶尖闭源模型持平。特别在长上下文处理方面,其性能已超越K2 Thinking模型,在SWE-Bench Verified测试中解决率达71.7%,BrowseComp搜索评估得分45.4,配合上下文管理后提升至58.3。sT428资讯网——每日最新资讯28at.com

技术架构层面,模型采用全局注意力(GA)与滑动窗口注意力(SWA)的1:5混合结构,既保持了线性注意力的计算效率,又显著提升了长文本处理能力。创新引入的多词元预测(MTP)训练技术,通过同步生成多个候选token并并行验证的方式,使解码吞吐量提升2-2.6倍。后训练阶段采用的多教师在线策略蒸馏(MOPD)方法,仅需传统方法1/50的计算资源即可达成同等优化效果,形成"教学-学习"闭环迭代机制。sT428资讯网——每日最新资讯28at.com

实际场景测试验证了模型的多样化能力:在网页开发任务中,可生成包含商品轮播、规格选择等功能的电商页面,以及支持手势交互的3D圣诞树应用;在创意生成方面,能创作忧郁爱情故事和非虚构社会观察作品;智能体交互测试中,既可解答"是否服用长生不老药"等哲学问题,也能编写科幻悬疑剧本。不过实测发现,部分复杂交互场景(如教育类太阳系探索器)仍存在稳定性问题,需多次生成才能达到预期效果。sT428资讯网——每日最新资讯28at.com

该模型已实现全面开源,推理代码完整贡献至开发者社区SGLang,API服务开启限时免费体验。技术文档显示,在Prefill单机吞吐50000 toks/s条件下,16K上下文长度的解码吞吐量达5000-15000 toks/s,单请求吞吐量151-115 toks/s。价格策略方面,输入token单价0.7元/百万,输出token单价2.1元/百万,显著低于行业平均水平。sT428资讯网——每日最新资讯28at.com

此次发布标志着小米大模型研发进入快车道。集团近期宣布将AI与现实世界深度结合列为未来十年核心战略,AI业务投入连续四个季度环比增长超50%。为加速技术突破,小米同步启动全球人才招募计划,设立千万元级岗位薪酬,重点引进大模型领域顶尖人才。技术团队近三个月已密集发布多篇学术论文,并陆续开源多个预训练模型,构建起完整的技术生态体系。sT428资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-188346-0.html小米发布MoE大模型MiMo-V2-Flash,性能媲美顶尖模型,多项实测表现亮眼

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 罗福莉小米首秀揭秘:MiMo-V2-Flash模型如何以高效结构实现推理加速

下一篇: 95后天才少女罗福莉首登小米演讲台,揭秘MiMo大模型及团队发展新路径

标签:
  • 热门焦点
  • K6:面向开发人员的现代负载测试工具

    K6 是一个开源负载测试工具,可以轻松编写、运行和分析性能测试。它建立在 Go 和 JavaScript 之上,它被设计为功能强大、可扩展且易于使用。k6 可用于测试各种应用程序,包括 Web
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 本地生活这块肥肉,拼多多也想吃一口

    出品/壹览商业 作者/李彦编辑/木鱼拼多多也看上本地生活这块蛋糕了。近期,拼多多在App首页“充值中心”入口上线了本机生活界面。壹览商业发现,该界面目前主要
  • 得物宠物生意「狂飙」,发力“它经济”

    作者|花花小萌主近日,得物宣布正式上线宠物鉴别,通过得物App内的“在线鉴别”,可找到鉴别宠物的选项。通过上传自家宠物的部位细节,就能收获拥有专业资质认证的得物鉴
  • 10天营收超1亿美元,《星铁》比《原神》差在哪?

    来源:伯虎财经作者:陈平安即便你没玩过《原神》,你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天,有粉丝因为索尼在PS平台上线《原神》,怒而
  • 小米公益基金会捐赠2500万元驰援北京、河北暴雨救灾

    8月2日消息,今日小米科技创始人雷军在其微博上发布消息称,小米公益基金会宣布捐赠2500万元驰援北京、河北暴雨救灾。携手抗灾,京冀安康!以下为公告原文
Top