当前位置:首页 > 科技  > 网络

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5

来源: 责编: 时间:2025-11-07 10:08:31 72观看
导读 快科技11月7日消息,日前,月之暗面宣布发布Kimi K2 Thinking,这是Kimi 迄今能力强的开源思考模型。目前,该模型已上线kimi.com和新版Kimi手机应用的常规对话模式。据了解,Kimi K2 Thinking原生掌握“边思考,

快科技11月7日消息,日前,月之暗面宣布发布Kimi K2 Thinking,这是Kimi 迄今能力强的开源思考模型。QJB28资讯网——每日最新资讯28at.com

目前,该模型已上线kimi.com和新版Kimi手机应用的常规对话模式。QJB28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5QJB28资讯网——每日最新资讯28at.com

据了解,Kimi K2 Thinking原生掌握“边思考,边使用工具”的能力,在人类后的考试(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中表现达到SOTA水平,超越GPT-5。QJB28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5QJB28资讯网——每日最新资讯28at.com

在Agentic搜索、Agentic编程、写作和综合推理能力等方面也取得全面提升。QJB28资讯网——每日最新资讯28at.com

据介绍,该模型无需人类干预,即可自主实现高达300轮的工具调用和持续稳定的多轮思考能力,从而帮助用户解决更复杂的问题。QJB28资讯网——每日最新资讯28at.com

人类后的考试是一项涵盖100多个专业领域的终极封闭式学术测试。QJB28资讯网——每日最新资讯28at.com

在允许使用工具——搜索、Python、网络浏览工具的同等情况下,Kimi K2 Thinking在这项基准评测中取得了44.9%的SOTA成绩。QJB28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5QJB28资讯网——每日最新资讯28at.com

根据官方示例显示,Kimi K2 Thinking经过5轮搜索和推理,结合每轮搜索到的新信息,层层深入,终推理出了答案:QJB28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5QJB28资讯网——每日最新资讯28at.com

此外,在复杂搜索和浏览场景中,Kimi K2 Thinking模型也表现出色。QJB28资讯网——每日最新资讯28at.com

BrowseComp是由OpenAI发布的一个专门评估AI Agent网络浏览能力的基准测试,这项测试的初衷是衡量AI Agent在信息过载环境中展现出的坚持性与创造力,即能否像人类研究员一样“刨根问底”。QJB28资讯网——每日最新资讯28at.com

在这项极具挑战的任务上,人类平均只能达到29.2%的成绩。QJB28资讯网——每日最新资讯28at.com

Kimi K2 Thinking在这项基准测试中展现出极强的钻研能力,以60.2%的成绩成为新的SOTA模型。QJB28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5QJB28资讯网——每日最新资讯28at.com

在长程规划和自主搜索能力的驱动下,Kimi K2 Thinking可借助多达上百轮的“思考→搜索→浏览网页→思考→编程”动态循环,持续地提出并完善假设、验证证据、进行推理,并构建出逻辑一致的答案。QJB28资讯网——每日最新资讯28at.com

这种边主动搜索边持续思考的能力,使Kimi K2 Thinking能够将模糊且开放式的问题分解为清晰、可执行的子任务。QJB28资讯网——每日最新资讯28at.com

在官方示例中,Kimi K2 Thinking经过两轮搜索和思考,先根据股票回购的已知信息找到了这家制造快速的公司,然后在美国证券交易委员会(SEC)的官网上找到了股票回购公告信息,得出了准确的答案:QJB28资讯网——每日最新资讯28at.com

Kimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5QJB28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-185510-0.htmlKimi强开源思考模型 Kimi K2 Thinking发布:推理等超越GPT-5

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 上海一杯“水”售价28元 店家回应:是口感像水的鸡尾酒

下一篇: 8000亿元大市场来了:我国显示产业驶入快车道

标签:
  • 热门焦点
  • Raft算法:保障分布式系统共识的稳健之道

    1. 什么是Raft算法?Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”(“可靠、可复制、可冗余、可容错”)的首字母缩写。Raft算法是一种用于在分布式系统
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • 服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 使用AIGC工具提升安全工作效率

    在日常工作中,安全人员可能会涉及各种各样的安全任务,包括但不限于:开发某些安全工具的插件,满足自己特定的安全需求;自定义github搜索工具,快速查找所需的安全资料、漏洞poc、exp
  • 三星获批量产iPhone 15全系屏幕:苹果史上最惊艳直屏

    按照惯例,苹果将继续在今年9月举办一年一度的秋季新品发布会,有传言称发布会将于9月12日举行,届时全新的iPhone 15系列将正式与大家见面,不出意外的话
  • 2299元起!iQOO Pad开启预售:性能最强天玑平板

    5月23日,iQOO如期举行了新品发布会,除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外,还在发布会上推出了旗下首款平板电脑——iQOO Pad,其搭载了天玑
  • OPPO K11样张首曝:千元机影像“卷”得真不错!

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
Top