当前位置:首页 > 元宇宙 > AI

清华大学合作推出体验式协同学习框架:让 AI 总结历史经验,大幅提高学习能力

来源: 责编: 时间:2024-01-08 09:13:50 416观看
导读 1 月 2 日消息,机器学习和人工智能已经在各行各业掀起了新的变革浪潮,其重点表现形式是各种大模型支撑的“智能体”(agent),指能自主活动的软件或者硬件实体。这些“智能体”可以和用户进行自然对话,并根据对话内容

1 月 2 日消息,机器学习和人工智能已经在各行各业掀起了新的变革浪潮,其重点表现形式是各种大模型支撑的“智能体”(agent),指能自主活动的软件或者硬件实体。DgZ28资讯网——每日最新资讯28at.com

DgZ28资讯网——每日最新资讯28at.com

这些“智能体”可以和用户进行自然对话,并根据对话内容独立处理各种任务,展示了它们在众多领域彻底改变任务解决方式的潜力。DgZ28资讯网——每日最新资讯28at.com

不过这些人工智能驱动的“智能体”面临的一个重大挑战是,它们倾向于孤立运行,经常会重复错误,并采用低效的试错方法,限制了它们的效率,阻碍了它们的学习过程。DgZ28资讯网——每日最新资讯28at.com

DgZ28资讯网——每日最新资讯28at.com

虽然大语言模型陆续开发了上下文敏感记忆、多步骤规划和战略性工具等高级功能,但这些“智能体”在执行任务时通常无法吸取历史经验,从而导致其解决问题的能力效率低下。DgZ28资讯网——每日最新资讯28at.com

来自清华大学、大连理工大学和北京邮电大学的科研团队近日推出了突破性框架--“体验式协同学习”(Experiential Co-Learning),目标是大幅提高“智能体”的学习能力。DgZ28资讯网——每日最新资讯28at.com

这一创新方法将过去的经验融入到“智能体”的操作结构中,从而重新定义了“智能体”的协作和学习方式。DgZ28资讯网——每日最新资讯28at.com

该框架包括三个不可分割的模块:共同追踪(co-tracking)、共同记忆(co-memorizing)和共同推理(co-reasoning),每个模块都在增强“智能体”的协作和学习能力方面发挥着至关重要的作用。DgZ28资讯网——每日最新资讯28at.com

共同追踪:

“智能体”进行合作演练,对各种训练任务的“程序轨迹”进行细致追踪。这种跟踪为“智能体”分享经验和合作制定策略奠定了基础。DgZ28资讯网——每日最新资讯28at.com

共同记忆

根据外部环境反馈,从这些轨迹中策略性地提取“快捷方式”,从而进一步推进上述工作。这些“快捷方式”被整合到“智能体”的集体经验库中,使他们能够参考过去的经验,加强未来的任务解决策略。DgZ28资讯网——每日最新资讯28at.com

共同推理

结合了“智能体”的集体经验库,使它们能够通过细化指令和响应进行更高级的互动。通过利用各自的经验知识,“智能体”可为未知任务提供更有洞察力和更准确的解决方案。DgZ28资讯网——每日最新资讯28at.com

团队在部署“体验式协同学习”之后,发现可显著提高“智能体”的学习能力,具备更高的协作效率,大大减少了重复性错误和执行时间,并减少了软件开发中对额外人力参与的需求。DgZ28资讯网——每日最新资讯28at.com

DgZ28资讯网——每日最新资讯28at.com

DgZ28资讯网——每日最新资讯28at.com

“智能体”能够从过去的经验中回忆并应用高质量的 "捷径",再结合底层 LLM 的能力,证明了性能的提高。DgZ28资讯网——每日最新资讯28at.com

该框架使“智能体”能够从过去的经验中学习并有效利用这些经验,从而弥补了它们在操作能力上的一个关键差距。DgZ28资讯网——每日最新资讯28at.com

这一进步提高了自主“智能体”的效率,减少了它们对人工干预的依赖,为未来的独立智能系统铺平了道路。DgZ28资讯网——每日最新资讯28at.com

附上论文参考地址:https://arxiv.org/abs/2312.17025v1DgZ28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-3145-0.html清华大学合作推出体验式协同学习框架:让 AI 总结历史经验,大幅提高学习能力

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 巨头联手打击 AI 造假:尼康索尼佳能相机将嵌入照片防伪技术

下一篇: iQOO Neo9手机系统更新,全亮度下实现2160Hz高频调光

标签:
  • 热门焦点
  • 一份全面清单:Web3行业高薪酬的13种工作

    来源:区块链骑士这可能会让许多人感到震惊,但除了成为开发人员之外,Web3还有其他高薪工作。Web3可能是现代就业市场中跨学科最多的领域,换句话说,它由许多个在不同领域中具有不同
  • 雷克萨斯高管,“受贿”5000万?

    来源:毒舌科技作者:潘磊雷克萨斯的高管,好像出事了。五六家日本小媒体,突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元(约合人民币5000
  • 这一超级富豪“逆袭”,身价大增4330亿

    来源:侃见财经互联网的突围没有“终点”。在快节奏的商业环境下,不断的试错成了互联网企业的标配,一年一个风口,一个风口造就一个热点,但是回头来看,最终受益的还是身处
  • FMIFAwards奖项即将揭晓!

    来源:X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
  • 网易音乐、理想申请元宇宙商标被驳回,“啫喱”暂停新用户进入

    【《原神》开发商米哈游宣布创立元宇宙品牌】《原神》开发商米哈游宣布推出元宇宙品牌 HoYoverse,旨在通过各种娱乐服务为全球玩家创造并提供沉浸式虚拟世界体
  • Layer1的新以太坊,更好的以太坊?

    以太坊作为区块链基础设施地位看起来已不可动摇,但也面临着费用高、效率低、偏离去中心化初衷等问题。平台上既得利益群体的形成和固化也逐渐让革新变得困难。
  • 从冰墩墩到无聊猿,解秘未来IP爆款的模因

    打造IP,是建设元宇宙的刚需。NFT能直接让IP的价值变现;虚拟人IP是元宇宙的第一入口,而元宇宙要搭建的,就是一个个品牌IP星球,考验的是IP世界观的建设能力。如果说在
  • 传统互联网与区块链场景下数据权利法律分析

    数据权益的复杂性在于数据涉及多环节多主体、内容不同质且与不同场景紧密联系、对软硬件技术环节紧密相关等方面的复杂性。在传统互联网与区块链模式下,数据处
  • Meta 在衰落吗?

    扎克伯格已经很久没有出现在公众视野里了,近日,他罕见的接受播客采访,在两个小时的时间里畅谈了Meta、Facebook、Instagram、元宇宙的未来。正方观点:是的阿伦·达
Top