当前位置:首页 > 元宇宙 > AI

月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

来源: 责编: 时间:2025-06-24 09:33:26 111观看
导读 6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent

6 月 21 日消息,从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试。2Qj28资讯网——每日最新资讯28at.com

2Qj28资讯网——每日最新资讯28at.com

Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。其后,月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。2Qj28资讯网——每日最新资讯28at.com

对于每一个问题,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果:2Qj28资讯网——每日最新资讯28at.com

澄清问题(clarification):理解问题时主动反问,构建更清晰的问题空间;2Qj28资讯网——每日最新资讯28at.com

深入思考:每个任务平均进行 23 步推理,自主梳理并解决需求;2Qj28资讯网——每日最新资讯28at.com

主动搜索:每个任务,平均规划 74 个关键词,找到 206 个网址,由模型判断并筛选出信息质量最高的前 3.2% 内容,剔除冗余、低质信息;2Qj28资讯网——每日最新资讯28at.com

调用工具,交付结果:自主调用浏览器、代码等工具,处理原始数据、自动生成分析结论,端到端完成交付。2Qj28资讯网——每日最新资讯28at.com

为了保证输出的质量和信息覆盖度,Kimi-Researcher 采用异步执行方式,用更多时间逐步推理、检索和撰写内容。2Qj28资讯网——每日最新资讯28at.com

2Qj28资讯网——每日最新资讯28at.com

用户最终将收到 2 个交付成果。2Qj28资讯网——每日最新资讯28at.com

一份信息详实、可溯源的深度研究报告2Qj28资讯网——每日最新资讯28at.com

报告的平均长度在万字以上;2Qj28资讯网——每日最新资讯28at.com

平均引用约 26 个高质量、可溯源的信源;2Qj28资讯网——每日最新资讯28at.com

所有引用都内嵌在正文中,点击即可跳转,并高亮原文,便于验证与追溯。2Qj28资讯网——每日最新资讯28at.com

2Qj28资讯网——每日最新资讯28at.com

一个可交互、可分享的动态可视化报告2Qj28资讯网——每日最新资讯28at.com

结构化排版、思维导图,让趋势、异常等重要信息一眼可见;2Qj28资讯网——每日最新资讯28at.com

无需阅读全文,也能迅速把握整体结构与核心结论;2Qj28资讯网——每日最新资讯28at.com

支持在线生成链接并分享,方便展示。2Qj28资讯网——每日最新资讯28at.com

2Qj28资讯网——每日最新资讯28at.com

官方宣布,在专为 AI 设计的高难度 benchmark“人类最后一次考试(Humanity's Last Exam,HLE)”中,Kimi-Researcher 在完全零结构、无流程设计的设置下,得分如下:2Qj28资讯网——每日最新资讯28at.com

Pass@1 准确率:26.9%2Qj28资讯网——每日最新资讯28at.com

Pass@4 准确率:40.17%2Qj28资讯网——每日最新资讯28at.com

这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜中其他模型。2Qj28资讯网——每日最新资讯28at.com

2Qj28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13996-0.html月之暗面 Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 杰美特筹划重大资产重组,意在收购英伟达、华为昇腾生态伙伴思腾合力

下一篇: Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为

标签:
  • 热门焦点
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 错过了BRC20还有eths,eth铭文协议

    来源:三头鸟NFT大家好,我是鸟哥,了解鸟哥的人都知道鸟哥擅撸空投,说实话撸毛虽然回报大但周期还是有点长的,所以除了撸毛我们自己也在研究早期项目,打新,比如BRC20协议ordi当时就有
  • 内容行业大变天,爆款全靠AI?

    出品 | 微果酱(wjam123456)作者 | 陈出木题图 | 文心一格 AI的发展之快出乎所有人的预料,似乎一夜之间便呼啸而来。无论是资本的风向标,抑或是生活工作的辅助、流量口,还是茶余饭
  • 冰墩墩NFT遇冷,价格跌80%,日成交仅3笔。

    “两日上涨千倍”并不存在,且冰墩墩NFT的市场热度远不及社交媒体所称的那样高。2月11日,获得国际奥委会授权的2022冬奥会吉祥物冰墩墩相关NFT产品在nWayPlay上线
  • 2022年中国元宇宙系列报告:底层架构研究:虚拟引擎,擎动未来

    “虚拟引擎是元宇宙平台搭建的基本工具。在这样的条件下,虚拟引擎拥有了广阔的市场空间。也需要虚拟引擎拥有拥有强大的处理能力,能够高效快速的实现大量交互场
  • 中国银保监管委提示:谨慎投资,勿做接盘侠

    中国银保监管委,发布一则风险提示,内容围绕防范以“元宇宙”名义进行的非法集资风险。原文如下:近期,一些不法分子蹭热点,以“元宇宙投资项目”“元宇宙链游”等名
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • HTC Vive推出元宇宙平台Viverse;腾讯投资小米生态链AR眼镜厂商

    今日热点:HTC Vive正式推出元宇宙平台Viverse;腾讯投资小米生态链AR眼镜厂商北京蜂巢科技;面部追踪和眼动追踪是Quest下一版本的“重点”;索尼PSVR 2将推迟至2023
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
Top