当前位置:首页 > 科技  > 互联网

MiniMax新模型MiniMax-M1:50万刀成本,如何实现推理能力飞跃?

来源: 责编: 时间:2025-06-20 10:13:53 116观看
导读近期,国内AI大模型领域似乎陷入了一片沉寂,各大项目纷纷选择低调行事。曾备受瞩目的DeepSeek-R2,除了偶尔流传的半真半假的小道消息外,几乎再无任何动静。回望去年,AI六小虎之间的激烈竞争还历历在目,而今年的它们却仿佛集

近期,国内AI大模型领域似乎陷入了一片沉寂,各大项目纷纷选择低调行事。曾备受瞩目的DeepSeek-R2,除了偶尔流传的半真半假的小道消息外,几乎再无任何动静。LMf28资讯网——每日最新资讯28at.com

回望去年,AI六小虎之间的激烈竞争还历历在目,而今年的它们却仿佛集体进入了冬眠状态,鲜有新动作。LMf28资讯网——每日最新资讯28at.com

尽管期间也有新品发布,但总体而言,这些产品都未能激起太大的波澜,缺乏让人眼前一亮的创新和吸引力。LMf28资讯网——每日最新资讯28at.com

然而,就在昨日凌晨,这潭平静的水被一只突然苏醒的小虎搅动——MiniMax宣布正式开源其首个推理模型MiniMax-M1。LMf28资讯网——每日最新资讯28at.com

LMf28资讯网——每日最新资讯28at.com

从跑分图来看,MiniMax-M1在其他方面的表现算是中规中矩,但在MRCR(上下文长度测试)这一项上,却展现出了惊人的实力,与众多开源模型拉开了显著的差距,仅次于Gemini2.5Pro。LMf28资讯网——每日最新资讯28at.com

更令人惊讶的是,据MiniMax团队透露,该模型在强化学习阶段的算力成本仅为50多万美元,这无疑是一个以小博大的成功案例。LMf28资讯网——每日最新资讯28at.com

深入了解MiniMax-M1后,我们发现了其背后的两大亮点。首先,该模型采用了一种名为“闪电注意力”的机制,这是一种对传统注意力机制的优化,通过减少模型在处理数据时的读写次数,从而大幅提升了效率。LMf28资讯网——每日最新资讯28at.com

LMf28资讯网——每日最新资讯28at.com

其次,MiniMax-M1在RL训练框架上也进行了创新。针对推理模型中常见的“嗯”、“等等”、“啊哈”等语气词,MiniMax提出了一种名为CISPO的新算法。该算法通过略微调低这些词的影响力,既能让AI学到关键的推理思路,又不会因这些语气词而干扰整个训练过程。LMf28资讯网——每日最新资讯28at.com

LMf28资讯网——每日最新资讯28at.com

在实际体验中,MiniMax-M1的表现同样令人印象深刻。在上下文长度的测试中,该模型展现出了强大的能力。以一本约20万个单词的电子书《白鲸记》为例,我们在其中偷偷加入了一句话:“某人吃了生蚝后掉进了泥里”。当询问MiniMax-M1时,它迅速且准确地给出了回答,而DeepSeek则因无法处理如此长的上下文而败下阵来。LMf28资讯网——每日最新资讯28at.com

LMf28资讯网——每日最新资讯28at.com

LMf28资讯网——每日最新资讯28at.com

在科研文献的翻译上,MiniMax-M1也展现出了其独特的优势。它能够保持原文的格式,准确翻译内容,并将公式和图片完美嵌入到翻译结果中,为科研人员提供了极大的便利。LMf28资讯网——每日最新资讯28at.com

LMf28资讯网——每日最新资讯28at.com

然而,在编程能力的测试中,MiniMax-M1的表现则稍显不足。尽管它能够完成一些基本的编程任务,但在处理复杂逻辑和动画效果时,仍存在一定的提升空间。LMf28资讯网——每日最新资讯28at.com

尽管如此,MiniMax-M1的发布仍然为AI大模型领域带来了新的活力和期待。同时,MiniMax还宣布了为期五天的连更计划,每晚都将推出一款新模型,这无疑将进一步激发行业的关注和讨论。让我们共同期待MiniMax后续的表现吧!LMf28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-21-161404-0.htmlMiniMax新模型MiniMax-M1:50万刀成本,如何实现推理能力飞跃?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: REDMI K80至尊版全面评测:性能续航大升级,游戏体验再突破!

下一篇: 小米平板7S Pro 12.5评测:自研玄戒O1芯片,便携平板新选择

标签:
  • 热门焦点
  • 六大权益!华为8月服务日开启:手机免费贴膜、维修免人工费

    8月5日消息,一年一度的华为开发者大会2023(Together)日前在松山湖拉开帷幕,与此同时,华为8月服务日也式开启,到店可享六大专属权益。华为用户可在华为商城Ap
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • 2023 年的 Node.js 生态系统

    随着技术的不断演进和创新,Node.js 在 2023 年达到了一个新的高度。Node.js 拥有一个庞大的生态系统,可以帮助开发人员更快地实现复杂的应用。本文就来看看 Node.js 最新的生
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 慕岩炮轰抖音,百合网今何在?

    来源:价值研究所 作者:Hernanderz“难道就因为自己的一个产品牛逼了,从客服到总裁,都不愿意正视自己产品和运营上的问题,选择逃避了吗?”这一番话,出自百合网联合创
  • 消费结构调整丨巨头低价博弈,拼多多还卷得动吗?

    来源:征探财经作者:陈香羽随着流量红利的退潮,电商的存量博弈越来越明显。曾经主攻中高端与品质的淘宝天猫、京东重拾“低价”口号。而过去与他们错位竞争的拼多多,靠
  • 认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • 华为Mate60标准版细节曝光:经典星环相机模组回归

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
Top