当前位置:首页 > 科技  > 网络

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5

来源: 责编: 时间:2025-11-07 10:08:31 100观看
导读 快科技11月7日消息,日前,月之暗面宣布发布Kimi K2 Thinking,这是Kimi 迄今能力强的开源思考模型。目前,该模型已上线kimi.com和新版Kimi手机应用的常规对话模式。据了解,Kimi K2 Thinking原生掌握“边思考,

快科技11月7日消息,日前,月之暗面宣布发布Kimi K2 Thinking,这是Kimi 迄今能力强的开源思考模型。0bb28资讯网——每日最新资讯28at.com

目前,该模型已上线kimi.com和新版Kimi手机应用的常规对话模式。0bb28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-50bb28资讯网——每日最新资讯28at.com

据了解,Kimi K2 Thinking原生掌握“边思考,边使用工具”的能力,在人类后的考试(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中表现达到SOTA水平,超越GPT-5。0bb28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-50bb28资讯网——每日最新资讯28at.com

在Agentic搜索、Agentic编程、写作和综合推理能力等方面也取得全面提升。0bb28资讯网——每日最新资讯28at.com

据介绍,该模型无需人类干预,即可自主实现高达300轮的工具调用和持续稳定的多轮思考能力,从而帮助用户解决更复杂的问题。0bb28资讯网——每日最新资讯28at.com

人类后的考试是一项涵盖100多个专业领域的终极封闭式学术测试。0bb28资讯网——每日最新资讯28at.com

在允许使用工具——搜索、Python、网络浏览工具的同等情况下,Kimi K2 Thinking在这项基准评测中取得了44.9%的SOTA成绩。0bb28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-50bb28资讯网——每日最新资讯28at.com

根据官方示例显示,Kimi K2 Thinking经过5轮搜索和推理,结合每轮搜索到的新信息,层层深入,终推理出了答案:0bb28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-50bb28资讯网——每日最新资讯28at.com

此外,在复杂搜索和浏览场景中,Kimi K2 Thinking模型也表现出色。0bb28资讯网——每日最新资讯28at.com

BrowseComp是由OpenAI发布的一个专门评估AI Agent网络浏览能力的基准测试,这项测试的初衷是衡量AI Agent在信息过载环境中展现出的坚持性与创造力,即能否像人类研究员一样“刨根问底”。0bb28资讯网——每日最新资讯28at.com

在这项极具挑战的任务上,人类平均只能达到29.2%的成绩。0bb28资讯网——每日最新资讯28at.com

Kimi K2 Thinking在这项基准测试中展现出极强的钻研能力,以60.2%的成绩成为新的SOTA模型。0bb28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-50bb28资讯网——每日最新资讯28at.com

在长程规划和自主搜索能力的驱动下,Kimi K2 Thinking可借助多达上百轮的“思考→搜索→浏览网页→思考→编程”动态循环,持续地提出并完善假设、验证证据、进行推理,并构建出逻辑一致的答案。0bb28资讯网——每日最新资讯28at.com

这种边主动搜索边持续思考的能力,使Kimi K2 Thinking能够将模糊且开放式的问题分解为清晰、可执行的子任务。0bb28资讯网——每日最新资讯28at.com

在官方示例中,Kimi K2 Thinking经过两轮搜索和思考,先根据股票回购的已知信息找到了这家制造快速的公司,然后在美国证券交易委员会(SEC)的官网上找到了股票回购公告信息,得出了准确的答案:0bb28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-50bb28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-185510-0.htmlKimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 上海一杯“水”售价28元 店家回应:是口感像水的鸡尾酒

下一篇: 8000亿元大市场来了:我国显示产业驶入快车道

标签:
  • 热门焦点
  • K60 Pro官方停产 第三方瞬间涨价

    虽然没有官方宣布,但Redmi的一些高管也已经透露了,Redmi K60 Pro已经停产且不会补货,这一切都是为了即将到来的K60 Ultra铺路,属于厂家的正常操作。但有意思的是该机在停产之后
  • 俄罗斯:将审查iPhone等外国公司设备 保数据安全

    iPhone和特斯拉都属于在各自领域领头羊的品牌,推出的产品也也都是数一数二的,但对于一些国家而言,它们的产品可靠性和安全性还是在限制范围内。近日,俄罗斯联邦通信、信息技术
  • vivo TWS Air开箱体验:真轻 臻好听

    在vivo S15系列新机的发布会上,vivo的最新款真无线蓝牙耳机vivo TWS Air也一同发布,本次就这款耳机新品给大家带来一个简单的分享。外包装盒上,vivo TWS Air保持了vivo自家产
  • 0糖0卡0脂 旭日森林仙草乌龙茶优惠:15瓶到手29元

    旭日森林无糖仙草乌龙茶510ml*15瓶平时要卖为79.9元,今日下单领取50元优惠券,到手价为29.9元。产品规格:0糖0卡0脂,添加草本仙草汁,清凉爽口,富含茶多酚,保留
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 破圈是B站头上的紧箍咒

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集,2021年有优酷的《山河令》,2022年有爱奇艺的《苍兰诀》,今年却轮到小破站抓住了追
  • 超闭合精工铰链 彻底消灭缝隙 三星Galaxy Z Flip5与Galaxy Z Fold5发布

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。三星新一代折叠屏手机采用超闭合精工铰链,让折叠后的缝隙不再可见。同时,配合处
  • Android 14发布:首批适配机型公布

    5月11日消息,谷歌在今天凌晨举行了I/O大会,本次发布会谷歌带来了自家的AI语言模型PaLM 2、谷歌Pixel Fold折叠屏、谷歌Pixel 7a手机,同时发布了Androi
  • 中关村论坛11月25日开幕,15位诺奖级大咖将发表演讲

    11月18日,记者从2022中关村论坛新闻发布会上获悉,中关村论坛将于11月25至30日在京举行。本届中关村论坛由科学技术部、国家发展改革委、工业和信息化部、国务
Top