当前位置:首页 > 科技  > 软件

小米发布MoE大模型MiMo-V2-Flash,性能媲美顶尖模型,多项实测表现亮眼

来源: 责编: 时间:2025-12-18 12:45:42 80观看
导读小米今日正式发布并开源了最新一代MoE架构大模型MiMo-V2-Flash,该模型总参数规模达3090亿,激活参数150亿,在推理、编码及智能体应用场景中展现出显著优势。模型支持混合思维模式,用户可自由切换深度思考与即时响应模式,并

小米今日正式发布并开源了最新一代MoE架构大模型MiMo-V2-Flash,该模型总参数规模达3090亿,激活参数150亿,在推理、编码及智能体应用场景中展现出显著优势。模型支持混合思维模式,用户可自由切换深度思考与即时响应模式,并具备一键生成完整HTML网页的能力,可与Claude Code、Cursor等主流编码框架无缝协作。pjk28资讯网——每日最新资讯28at.com

在性能测试中,MiMo-V2-Flash与DeepSeek-V3.2形成直接竞争态势。基准数据显示,该模型在数学竞赛AIME 2025和科学知识GPQA-Diamond测试中位列开源模型前二,软件工程能力SWE验证及多语言测试中更超越所有开源竞品,性能表现与全球顶尖闭源模型持平。特别在长上下文处理方面,其性能已超越K2 Thinking模型,在SWE-Bench Verified测试中解决率达71.7%,BrowseComp搜索评估得分45.4,配合上下文管理后提升至58.3。pjk28资讯网——每日最新资讯28at.com

技术架构层面,模型采用全局注意力(GA)与滑动窗口注意力(SWA)的1:5混合结构,既保持了线性注意力的计算效率,又显著提升了长文本处理能力。创新引入的多词元预测(MTP)训练技术,通过同步生成多个候选token并并行验证的方式,使解码吞吐量提升2-2.6倍。后训练阶段采用的多教师在线策略蒸馏(MOPD)方法,仅需传统方法1/50的计算资源即可达成同等优化效果,形成"教学-学习"闭环迭代机制。pjk28资讯网——每日最新资讯28at.com

实际场景测试验证了模型的多样化能力:在网页开发任务中,可生成包含商品轮播、规格选择等功能的电商页面,以及支持手势交互的3D圣诞树应用;在创意生成方面,能创作忧郁爱情故事和非虚构社会观察作品;智能体交互测试中,既可解答"是否服用长生不老药"等哲学问题,也能编写科幻悬疑剧本。不过实测发现,部分复杂交互场景(如教育类太阳系探索器)仍存在稳定性问题,需多次生成才能达到预期效果。pjk28资讯网——每日最新资讯28at.com

该模型已实现全面开源,推理代码完整贡献至开发者社区SGLang,API服务开启限时免费体验。技术文档显示,在Prefill单机吞吐50000 toks/s条件下,16K上下文长度的解码吞吐量达5000-15000 toks/s,单请求吞吐量151-115 toks/s。价格策略方面,输入token单价0.7元/百万,输出token单价2.1元/百万,显著低于行业平均水平。pjk28资讯网——每日最新资讯28at.com

此次发布标志着小米大模型研发进入快车道。集团近期宣布将AI与现实世界深度结合列为未来十年核心战略,AI业务投入连续四个季度环比增长超50%。为加速技术突破,小米同步启动全球人才招募计划,设立千万元级岗位薪酬,重点引进大模型领域顶尖人才。技术团队近三个月已密集发布多篇学术论文,并陆续开源多个预训练模型,构建起完整的技术生态体系。pjk28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-188346-0.html小米发布MoE大模型MiMo-V2-Flash,性能媲美顶尖模型,多项实测表现亮眼

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 罗福莉小米首秀揭秘:MiMo-V2-Flash模型如何以高效结构实现推理加速

下一篇: 95后天才少女罗福莉首登小米演讲台,揭秘MiMo大模型及团队发展新路径

标签:
  • 热门焦点
  • 太卷!Redmi MAX 100英寸电视便宜了:12999元买Redmi史上最大屏

    8月5日消息,从小米商城了解到,Redmi MAX 100英寸巨屏电视日前迎来官方优惠,到手价12999元,比发布价便宜了7000元,在大屏电视市场开卷。据了解,Redmi MAX 100
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 如何使用JavaScript创建一只图像放大镜?

    译者 | 布加迪审校 | 重楼如果您曾经浏览过购物网站,可能遇到过图像放大功能。它可以让您放大图像的特定区域,以便浏览。结合这个小小的重要功能可以大大改善您网站的用户体验
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 本地生活这块肥肉,拼多多也想吃一口

    出品/壹览商业 作者/李彦编辑/木鱼拼多多也看上本地生活这块蛋糕了。近期,拼多多在App首页“充值中心”入口上线了本机生活界面。壹览商业发现,该界面目前主要
  • 质感不错!OPPO K11渲染图曝光:旗舰IMX890传感器首次下放

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • onebot M24巧系列一体机采用轻薄机身设计,现已在各平台开售

    onebot M24 巧系列一体机目前已在线上线下各平台同步开售。onebot M24 巧系列采用一体化轻薄机身设计,最薄处为 10.15mm,拥有宝石红、午夜蓝、石墨绿、雅致
Top