当前位置:首页 > 科技  > 软件

MiniMax发布全球首个开源混合架构推理模型M1,性能卓越

来源: 责编: 时间:2025-06-20 10:15:47 218观看
导读稀宇科技近日宣布了一项重大计划,将在未来五天内连续发布一系列重要更新。首当其冲的是开源其首个推理模型——MiniMax-M1,这一消息引起了业界的广泛关注。MiniMax-M1被标榜为世界上首个开源的大规模混合架构推理模型,稀

稀宇科技近日宣布了一项重大计划,将在未来五天内连续发布一系列重要更新。首当其冲的是开源其首个推理模型——MiniMax-M1,这一消息引起了业界的广泛关注。5KS28资讯网——每日最新资讯28at.com

MiniMax-M1被标榜为世界上首个开源的大规模混合架构推理模型,稀宇科技对其性能赞誉有加。据官方介绍,M1在面向生产力的复杂场景中表现出色,其能力在开源模型中名列前茅,甚至超越了国内的闭源模型,接近海外的最顶尖水平。同时,M1还具备业内最高的性价比,为用户提供了高效且经济的解决方案。5KS28资讯网——每日最新资讯28at.com

M1的两大技术创新是其高效训练过程的关键。稀宇科技透露,M1仅用了3周时间和512块H800 GPU就完成了强化学习训练阶段,算力租赁成本仅为53.47万美元(约合384.1万元人民币),远低于最初的预期。这一高效训练过程得益于独创的混合架构和更快的强化学习算法CISPO。5KS28资讯网——每日最新资讯28at.com

混合架构以闪电注意力机制为主,使得M1在计算长上下文输入和深度推理时具有显著优势。例如,在处理8万Token的深度推理任务时,M1仅需使用DeepSeek R1约30%的算力。CISPO算法通过裁剪重要性采样权重来提升强化学习效率,在AIME实验中表现出比包括字节近期提出的DAPO等算法更快的收敛性能。5KS28资讯网——每日最新资讯28at.com

在业内主流的17个评测集上,M1的表现同样令人瞩目。特别是在软件工程、长上下文与工具使用等面向生产力的复杂场景中,M1展现出显著优势。在SWE-bench验证基准上,MiniMax-M1-40k和MiniMax-M1-80k分别取得了55.6%和56.0%的优异成绩,虽然略逊于DeepSeek-R1-0528的57.6%,但远超其他开源权重模型。同时,M1系列在长上下文理解任务中也表现出色,全球排名第二,仅次于Gemini 2.5 Pro。5KS28资讯网——每日最新资讯28at.com

在代理工具使用场景(TAU-bench)中,MiniMax-M1-40k同样领跑所有开源权重模型,并战胜了Gemini-2.5 Pro。值得注意的是,MiniMax-M1-80k在大多数基准测试中始终优于MiniMax-M1-40k,这充分验证了扩展测试时计算资源的有效性。5KS28资讯网——每日最新资讯28at.com

稀宇科技还透露,M1的详细技术报告和完整模型权重可在官方Hugging Face和GitHub账号上访问。vLLM和Transformer两个开源项目也提供了各自的推理部署支持,稀宇科技正与SGLang合作推进更多部署支持。由于M1相对高效的训练和推理算力使用,稀宇科技在MiniMax App和Web上都保持不限量免费使用,并以业内最低的价格在官网提供API服务。5KS28资讯网——每日最新资讯28at.com

稀宇科技的这一系列更新无疑为业界带来了新的活力和机遇。随着后续更新的陆续发布,我们期待稀宇科技能够继续为用户带来更多创新和突破。5KS28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-161422-0.htmlMiniMax发布全球首个开源混合架构推理模型M1,性能卓越

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 曙光数创引领液冷革命:全生命周期方案为数据中心“降温”

下一篇: Meta×Oakley智能眼镜周五发布,扎克伯格力挺,运动科技新风口?

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • Redmi Buds 4开箱简评:才199还有降噪 可以无脑入

    在上个月举办的Redmi Note11T Pro系列新机发布会上,除了两款手机新品之外,Redmi还带来了两款TWS真无线蓝牙耳机产品,Redmi Buds 4和Redmi Buds 4 Pro,此前我们在Redmi Note11T
  • 2023年Q2用户偏好榜:12+256G版本成新主流

    3月份的性能榜、性价比榜和好评榜之后,就要轮到2023年的第二季度偏好榜了,上半年的新机潮已经过去,最明显的肯定就是大内存和存储的机型了,另外部分中端机也取消了屏幕塑料支架
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • 华为和江淮汽车合作开发百万元问界MPV?双方回应来了

    8月1日消息,郭明錤今天在社交平台发文称,华为正在和江淮汽车合作,开发售价在100万元的问界MPV,预计在2024年第2季度量产,销量目标为上市首年交付5万辆。
  • iQOO 11S新品发布会

    iQOO将在7月4日19:00举行新品发布会,推出杭州亚运会电竞赛事官方用机iQOO 11S。
Top