当前位置:首页 > 元宇宙 > AI

中国科大新成果入选 ICLR 2025:特定领域仅用 5% 训练数据,知识准确率提升 14%

来源: 责编: 时间:2025-04-09 12:34:37 199观看
导读 让大语言模型更懂特定领域知识,有新招了!来自中国科学技术大学 MIRA 实验室的王杰教授团队提出了一个创新的框架 —— 知识图谱驱动的监督微调(KG-SFT),该框架通过引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的

让大语言模型更懂特定领域知识,有新招了!q8C28资讯网——每日最新资讯28at.com

来自中国科学技术大学 MIRA 实验室的王杰教授团队提出了一个创新的框架 —— 知识图谱驱动的监督微调(KG-SFT),该框架通过引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的知识理解和处理能力。q8C28资讯网——每日最新资讯28at.com

实验结果表明,其在多个领域和多种语言的数据集上取得了显著的效果,成功入选 ICLR 2025。q8C28资讯网——每日最新资讯28at.com

q8C28资讯网——每日最新资讯28at.com

截至目前,LLMs 在常识问答方面表现越来越出色,但它们对领域知识的理解和推理能力仍然有限。q8C28资讯网——每日最新资讯28at.com

由于难以深入理解专业领域问答背后所蕴含的复杂知识和逻辑关系,因此在面对这类问题时,往往无法准确地给出正确的答案和详细的推理过程,这极大地限制了其在专业领域的应用价值。q8C28资讯网——每日最新资讯28at.com

尤其是在数据稀少和知识密集型的场景中,如何让 LLMs 更好地理解和操纵知识,成为了研究的关键。q8C28资讯网——每日最新资讯28at.com

而中科大 MIRA 实验室的这项工作即围绕此展开。q8C28资讯网——每日最新资讯28at.com

KG-SFT 是如何工作的

KG-SFT 针对 LLMs 难以理解领域问答背后的知识和逻辑,导致推理能力弱的问题,提出基于知识图谱增强的大语言模型监督微调技术。q8C28资讯网——每日最新资讯28at.com

KG-SFT 首先通过解析领域知识图谱中的多条推理路径,设计图上推理路径与文本推理过程的联合生成机制。使 LLMs 在监督微调过程中,能够同步输出推理答案以及蕴含丰富领域知识和逻辑关系的推理过程,从而提升其对领域知识的理解与推理能力。q8C28资讯网——每日最新资讯28at.com

KG-SFT 框架的核心在于将知识图谱与监督微调相结合,通过生成问答背后的逻辑严密的推理过程解释来增强 LLMs 对知识和逻辑的理解。q8C28资讯网——每日最新资讯28at.com

该框架包含三个关键组件:q8C28资讯网——每日最新资讯28at.com

Extractor(提取器)q8C28资讯网——每日最新资讯28at.com

Generator(生成器)q8C28资讯网——每日最新资讯28at.com

Detector(检测器)q8C28资讯网——每日最新资讯28at.com

q8C28资讯网——每日最新资讯28at.com

1、Extractor:精准提取知识关联q8C28资讯网——每日最新资讯28at.com

Extractor 首先对问答对(Q&A)中的实体进行识别,并从外部知识图谱中提取相关的推理子图。q8C28资讯网——每日最新资讯28at.com

这一步骤揭示了 Q&A 对背后的知识关联和逻辑,为后续的解释生成提供了基础。q8C28资讯网——每日最新资讯28at.com

通过命名实体识别(NER)和多条推理路径的检索,Extractor 能够有效地从大规模知识图谱中获取与问题相关的知识。q8C28资讯网——每日最新资讯28at.com

2、Generator:生成流畅的解释q8C28资讯网——每日最新资讯28at.com

Generator 利用图结构重要性评分算法(如 HITS 算法)对推理子图中的实体和关系进行评分,选择高分部分作为重要内容。q8C28资讯网——每日最新资讯28at.com

然后,使用大型语言模型(如 ChatGPT)生成流畅的解释草稿。q8C28资讯网——每日最新资讯28at.com

这些解释不仅逻辑清晰,而且能够帮助 LLMs 更好地理解问题和答案之间的关系。q8C28资讯网——每日最新资讯28at.com

3、Detector:确保解释的正确性q8C28资讯网——每日最新资讯28at.com

Detector 对生成的解释草稿进行句子级别的知识冲突检测,确保解释的正确性。q8C28资讯网——每日最新资讯28at.com

通过自然语言推理(NLI)模型(如 DeBERTa)和重新引导机制,Detector 能够标记并纠正可能存在的知识冲突,从而提高解释的可靠性。q8C28资讯网——每日最新资讯28at.com

实验结果及创新点

实验结果表明,KG-SFT 在多个领域和语言设置中均取得了显著的性能提升。q8C28资讯网——每日最新资讯28at.com

特别是在低数据医学问答任务上,KG-SFT 在英语场景中仅使用 5% 的训练数据就比传统方法提高了近 14% 的准确率。q8C28资讯网——每日最新资讯28at.com

q8C28资讯网——每日最新资讯28at.com

从创新之处来看,KG-SFT 不仅关注数据的数量,更注重数据的质量。q8C28资讯网——每日最新资讯28at.com

通过生成高质量的解释,KG-SFT 帮助 LLMs 更好地理解和操纵知识,从而在特定领域实现更优的性能。q8C28资讯网——每日最新资讯28at.com

此外,KG-SFT 还可以作为插件式模块与现有的数据增强方法结合使用,进一步提升性能。q8C28资讯网——每日最新资讯28at.com

q8C28资讯网——每日最新资讯28at.com

在多领域数据集上的实验结果进一步验证了 KG-SFT 的广泛适用性。q8C28资讯网——每日最新资讯28at.com

尽管在某些需要复杂推理的领域(如形式逻辑和专业会计)中表现稍逊,但整体性能依然具有较强的竞争力。q8C28资讯网——每日最新资讯28at.com

q8C28资讯网——每日最新资讯28at.com

概括而言,KG-SFT 框架通过结合知识图谱和 LLMs,有效地提升了监督微调数据的质量,从而显著提高了 LLMs 在特定领域的性能。q8C28资讯网——每日最新资讯28at.com

这一方法不仅在低数据场景中表现出色,还展示了其作为插件式模块与现有数据增强方法结合的潜力。q8C28资讯网——每日最新资讯28at.com

论文作者第一作者陈瀚铸是中国科学技术大学 2021 级硕博连读生,师从王杰教授,主要研究方向为大语言模型、知识图谱和推理数据合成。q8C28资讯网——每日最新资讯28at.com

更多细节欢迎查阅原论文。q8C28资讯网——每日最新资讯28at.com

论文地址:q8C28资讯网——每日最新资讯28at.com

https://openreview.net/pdf?id=oMFOKjwaRSq8C28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位(ID:QbitAI),作者:KG-SFT 团队,原标题《中科大 ICLR2025:特定领域仅用 5% 训练数据,知识准确率提升 14%》q8C28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12083-0.html中国科大新成果入选 ICLR 2025:特定领域仅用 5% 训练数据,知识准确率提升 14%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 大模型时代来临,阿丘科技如何以AI检测引领工业视觉新变革?

下一篇: 微软 AI 版《雷神之锤 2》遭喷:模糊、耗电,亵渎开发者工作

标签:
  • 热门焦点
  • 沉寂3年,大模型激活小度天猫精灵?

    Tech星球(微信ID:tech618)文 | 何煦阳 沉寂了许久的智能音箱,在今年大模型横空出世之后,又再次燃起了新的希望。 2月9日,小度宣布将融合文心一言,打造针对智能设备场景的AI模型&ldq
  • 25万虚拟er在“元宇宙”追星

    “默叽默叽,我是默默酱,我是在真元宇宙也有头有脸的人。”12月11日晚20:00,虚拟偶像@默默酱的首场个人元宇宙演唱会《以梦为马,抵达繁星》在大有空间APP
  • 企业热、用户冷,元宇宙第一站将是“营销场”?

    如果说2021年底什么最火热,那元宇宙当之无愧。“万物皆可元宇宙”似乎成为新的流行语,在广告中也常常听到“社交元宇宙”“购物元宇宙”等等。就在近日,有消息传
  • 从NFT顶级公链到Web3.0基础设施:带你了解不一样的Flow

    对于大部分年轻人来说,刚刚过去的春节有一个词语突然成为了品牌宣传的流行语,作为从NFT中衍生出来的“数字藏品”一时间获得了不少品牌青睐,他们纷纷推出自己的数
  • 从虚拟餐厅到虚拟时装秀,行业巨头掀起元宇宙商标注册潮

    自从 Facebook 更名为 Meta 后,关于元宇宙的讨论愈发激烈,这一词汇也越来越多的出现在我们的视野里。这是一个非常有趣的话题。伴随着争论,有些人认为是马克·扎
  • 音乐NFT平台里的下一匹黑马是谁?

    NFT 销售额在 2021 年开始暴涨,从 2018 年的仅 4069 万美元的交易量,到 2021 年,NFT 交易量飙升至 442 亿美元以上,并不断刷新记录并达到新的高度。预测到2025 年N
  • NFT世界的艺术家名单

    我们汇编了以下艺术家的名单,它包括每个艺术家的简短概述。当然,这份名单肯定不全面,还有很多很多艺术家、哲学家和商业领袖为世界贡献了不可估量的价值。而他们
  • 从4个方面解析2022年加密行业趋势

    作者:去月球基础设施瓶颈仍然存在尽管2021年公链基础设施之间的竞争显著升温,但关键瓶颈仍需解决。例如,以太坊作为DApp开发的顶级公链,仍然遭受网络拥塞和高额交
  • 虚拟人行业研究报告

    最早的虚拟人出现于 20 世纪 80 年代,受限于技术,当时的虚拟人制作以手绘为主。21 世纪初,随着动捕、渲染等技术的逐步发展,虚拟人相关技术开始在影视领域逐渐普及
Top