当前位置:首页 > 元宇宙 > AI

阿里巴巴开源自主搜索 AI 智能体 WebAgent

来源: 责编: 时间:2025-06-02 11:05:28 97观看
导读 5 月 30 日消息,阿里巴巴昨日在 Github 上开源了其创新的自主搜索 AI Agent——WebAgent,具备端到端的自主信息检索与多步推理能力,能够像人类一样在网络环境中主动感知、决策和行动。例如,当用户想了解某个特定

5 月 30 日消息,阿里巴巴昨日在 Github 上开源了其创新的自主搜索 AI Agent——WebAgent,具备端到端的自主信息检索与多步推理能力,能够像人类一样在网络环境中主动感知、决策和行动。AiV28资讯网——每日最新资讯28at.com

例如,当用户想了解某个特定领域的最新研究成果时,WebAgent 能够主动搜索多个学术数据库,筛选出最相关的文献,并根据用户的需求进行深入分析和总结。AiV28资讯网——每日最新资讯28at.com

据介绍,WebAgent 不仅能识别文献中的关键信息,还能通过多步推理将不同文献中的观点进行整合,最终为用户提供一份全面且精准的研究报告。AiV28资讯网——每日最新资讯28at.com

AiV28资讯网——每日最新资讯28at.com

阿里巴巴 WebAgent 分为 WebDancer 和 WebWalker,前者是一种端到端智能体训练框架,旨在增强基于网络的 AI 智能体的多步骤信息搜索能力;后者则属于“Web 遍历中的 LLM 基准测试”。AiV28资讯网——每日最新资讯28at.com

AiV28资讯网——每日最新资讯28at.com

Web Agents 上的性能:AiV28资讯网——每日最新资讯28at.com

AiV28资讯网——每日最新资讯28at.com

WebDancer 的框架一共由 4 大块组成,从数据构建到训练优化,逐步打造出能够自主完成复杂信息检索任务的智能体。AiV28资讯网——每日最新资讯28at.com

浏览数据构建是整个框架的起点。在现实世界中,高质量的训练数据是智能体能够有效学习和泛化的关键。WebDancer 通过两种创新的数据合成方法来解决传统数据集的局限性。AiV28资讯网——每日最新资讯28at.com

为了确保生成的轨迹既有效又连贯,WebDancer 采用了短推理和长推理两种方法。短推理利用大模型直接生成简洁的推理路径,而长推理则通过推理模型逐步构建复杂的推理过程。AiV28资讯网——每日最新资讯28at.com

在数据准备完成后,WebDancer 进入监督微调(SFT)阶段。这一阶段的目标是通过高质量的轨迹数据对智能体进行初始化训练,使其能够适应信息检索任务的格式和环境要求。AiV28资讯网——每日最新资讯28at.com

在 SFT 过程中,WebDancer 将轨迹中的思考、行动和观察内容分别标记,并计算损失函数,以优化模型的参数。为了提高模型的鲁棒性,WebDancer 在计算损失时排除了外部反馈的影响,确保模型能够专注于自主决策过程。这一阶段的训练为智能体提供了强大的初始能力,使其能够在后续的强化学习阶段更好地适应复杂的任务环境。AiV28资讯网——每日最新资讯28at.com

强化学习(RL)阶段是 WebDancer 框架的关键环节。在这一阶段,智能体通过与环境的交互,学习如何在复杂的任务中做出最优决策。WebDancer 采用了 DAPO 算法,这是一种专门针对智能体训练设计的强化学习算法。AiV28资讯网——每日最新资讯28at.com

DAPO 算法通过动态采样机制,有效利用未充分利用的 QA 对,提高数据效率和策略的鲁棒性。在 RL 过程中,智能体通过多次尝试和反馈,逐步优化其决策策略,最终实现高效的多步推理和信息检索能力。AiV28资讯网——每日最新资讯28at.com

附 WebAgent 官方地址:AiV28资讯网——每日最新资讯28at.com

Github:https://github.com/Alibaba-NLP/WebAgentAiV28资讯网——每日最新资讯28at.com

WebDancer论文:https://arxiv.org/ pdf/2505.22648AiV28资讯网——每日最新资讯28at.com

WebWalker论文:https://arxiv.org/ pdf/2501.07572AiV28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-13298-0.html阿里巴巴开源自主搜索 AI 智能体 WebAgent

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: AI“电老虎”:2025 年底预估占全球数据中心近 50% 用电量,首超加密货币挖矿

下一篇: OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞

标签:
  • 热门焦点
  • ChatGPT访问量增速下滑,AI真的是一场泡沫吗?

    来源:首席商业评论2023年,最火的莫过于ChatGPT,席卷全球的同时也引发了生成式AI(人工智能)的投资热潮。在美股,ChatGPT相关概念股飙涨,以AI算力龙头英伟达为例,其股价年内一度累计上
  • 一份全面清单:Web3行业高薪酬的13种工作

    来源:区块链骑士这可能会让许多人感到震惊,但除了成为开发人员之外,Web3还有其他高薪工作。Web3可能是现代就业市场中跨学科最多的领域,换句话说,它由许多个在不同领域中具有不同
  • 大厂元宇宙,又菜又爱玩

    撰文 | 吴先之 编辑 | 王 潘当下所有大厂推出的元宇宙产品,所能带来的沉浸式体验并不多,好在国内外科技巨头在bug方面都处在同一水平线。以Meta为例,由于VR头显设
  • 2022开年最热投资赛道竟是虚拟人,背后隐藏了什么商业价值?

    在刚刚结束不久的2021年江苏卫视跨年演唱会上,虚拟邓丽君与歌手周深同台联唱,实现了跨时代合作,而这还不只是“邓丽君”,哔哩哔哩、东方卫视等多家跨年晚会都出现
  • 2022年的Web3:定义概念并开创新范式

    Web3 是关于加密和区块链应该如何使用的概念,因为它是加密圈的一个离散子领域。社区机会将呈指数级增长,扩大这些子行业的人口统计范围。追求 Web3 项目的组织仍
  • 元宇宙是推动NFT发展的初始家园

    现在大家都知道了什么是NFT,但好像离自己的生活还有一定距离。随着我们与NFT 接触增加,该如何将这些数字资产带入我们的日常生活?NFT还是主流吗?如果我们将“主流
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • 元宇宙风归何处?

    元宇宙持续大火,在过去一段时间内,其屡次登上热点,吸引了一波又一波投资者。近期,在“2022中国·金鱼嘴元宇宙生态赋能大会”上,南京建邺区金鱼嘴基金街区宣布计划
  • GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+Defi(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
Top