28资讯网

28资讯网

当前位置：首页 > 科技 > 网络

Kimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

来源：责编：时间：2025-11-07 10:08:31 101观看

导读快科技11月7日消息，日前，月之暗面宣布发布Kimi K2 Thinking，这是Kimi 迄今能力强的开源思考模型。目前，该模型已上线kimi.com和新版Kimi手机应用的常规对话模式。据了解，Kimi K2 Thinking原生掌握“边思考，

快科技11月7日消息，日前，月之暗面宣布发布Kimi K2 Thinking，这是Kimi 迄今能力强的开源思考模型。

目前，该模型已上线kimi.com和新版Kimi手机应用的常规对话模式。

Kimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

据了解，Kimi K2 Thinking原生掌握“边思考，边使用工具”的能力，在人类后的考试（Humanity's Last Exam）、自主网络浏览能力（BrowseComp）、复杂信息收集推理（SEAL-0）等多项基准测试中表现达到SOTA水平，超越GPT-5。

Kimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

在Agentic搜索、Agentic编程、写作和综合推理能力等方面也取得全面提升。

据介绍，该模型无需人类干预，即可自主实现高达300轮的工具调用和持续稳定的多轮思考能力，从而帮助用户解决更复杂的问题。

人类后的考试是一项涵盖100多个专业领域的终极封闭式学术测试。

在允许使用工具——搜索、Python、网络浏览工具的同等情况下，Kimi K2 Thinking在这项基准评测中取得了44.9%的SOTA成绩。

Kimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

根据官方示例显示，Kimi K2 Thinking经过5轮搜索和推理，结合每轮搜索到的新信息，层层深入，终推理出了答案：

Kimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

此外，在复杂搜索和浏览场景中，Kimi K2 Thinking模型也表现出色。

BrowseComp是由OpenAI发布的一个专门评估AI Agent网络浏览能力的基准测试，这项测试的初衷是衡量AI Agent在信息过载环境中展现出的坚持性与创造力，即能否像人类研究员一样“刨根问底”。

在这项极具挑战的任务上，人类平均只能达到29.2%的成绩。

Kimi K2 Thinking在这项基准测试中展现出极强的钻研能力，以60.2%的成绩成为新的SOTA模型。

Kimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

在长程规划和自主搜索能力的驱动下，Kimi K2 Thinking可借助多达上百轮的“思考→搜索→浏览网页→思考→编程”动态循环，持续地提出并完善假设、验证证据、进行推理，并构建出逻辑一致的答案。

这种边主动搜索边持续思考的能力，使Kimi K2 Thinking能够将模糊且开放式的问题分解为清晰、可执行的子任务。

在官方示例中，Kimi K2 Thinking经过两轮搜索和思考，先根据股票回购的已知信息找到了这家制造快速的公司，然后在美国证券交易委员会（SEC）的官网上找到了股票回购公告信息，得出了准确的答案：

Kimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

本文链接：http://www.28at.com/showinfo-17-185510-0.htmlKimi强开源思考模型 Kimi K2 Thinking发布：推理等超越GPT-5

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：上海一杯“水”售价28元店家回应：是口感像水的鸡尾酒

下一篇： 8000亿元大市场来了：我国显示产业驶入快车道

标签：

热门焦点

7月安卓手机好评榜：三星S23Ultra好评率第一

性能榜和性价比榜之后，我们来看最后的安卓手机好评榜，数据来源安兔兔评测，收集时间2023年7月1日至7月31日，仅限国内市场。第一名：三星Galaxy S23 Ultra好评率：95.71%在即将迎来新
一文看懂为苹果Vision Pro开发应用程序

译者 | 布加迪审校 | 重楼苹果的Vision Pro是一款混合现实（MR）头戴设备。Vision Pro结合了虚拟现实（VR）和增强现实（AR）的沉浸感。其高分辨率显示屏、先进的传感器和强大的处理能力
让我们一起聊聊文件的操作

文件【1】文件是什么？文件是保存数据的地方，是数据源的一种，比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据，它既可以保
一个注解实现接口幂等，这样才优雅！

场景码猿慢病云管理系统中其实高并发的场景不是很多，没有必要每个接口都去考虑并发高的场景，比如添加住院患者的这个接口，具体的业务代码就不贴了，业务伪代码如下：图片上述代码有
阿里大调整

来源：产品刘有媒体报道称，近期淘宝天猫集团启动了近年来最大的人力制度改革，涉及员工绩效、层级体系等多个核心事项，目前已形成一个初步的“征求意见版”：1、取消P序列
iQOO Neo8系列今日官宣：首发天玑9200+ 全球安卓最强芯！

在昨日举行的的联发科新一代旗舰芯片天玑9200+的发布会上，iQOO官方也正式宣布，全新的iQOO Neo8系列新品将全球首发搭载这款当前性能最强大的移动平台
联想YOGA 16s 2022笔记本将要推出，屏幕支持触控功能

联想此前宣布，将于11月2日19:30召开联想秋季轻薄新品发布会，推出联想 YOGA 16s 2022 笔记本等新品。官方称，YOGA 16s 2022 笔记本将搭载 16 英寸屏幕，并且是一
微软发布Windows 11新版引入全新任务栏状态

近日，微软发布了Windows 11新版，而Build 22563更新主要引入了几周前曝光的平板模式任务栏等，系统更流畅了。更新中，Windows 11加入了专门针对平板优化的任务栏
2021中国国际消费电子博览会与青岛国际软件融合创新博览会新闻发布会隆重举行

9月18日，2021中国国际消费电子博览会与青岛国际软件融合创新博览会新闻发布会在青岛国际新闻中心隆重举行。发布会上青岛市政府领导联袂出席，对本次双展会情

最新推荐

猜你喜欢

热门推荐

相关资讯

Top