当前位置:首页 > 科技  > 通信

合合信息TextIn发布“大模型加速器2.0”,文档单页处理耗时降低超30%

来源: 责编: 时间:2025-03-25 10:05:10 165观看
导读 阿里云优惠券 先领券再下单随着大模型在社会应用中逐渐普及,人们在享受便利的同时,也面临着“AI 幻觉”产生的风险。训练数据是影响大模型“认知能力”的关键要素,近期,上海合合信息科技股份有限公

 阿里云优惠券 先领券再下单1Ps28资讯网——每日最新资讯28at.com

随着大模型在社会应用中逐渐普及,人们在享受便利的同时,也面临着“AI 幻觉”产生的风险。训练数据是影响大模型“认知能力”的关键要素,近期,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器 2.0”版本正式上线,基于领先的智能文档处理技术,对复杂文档的版式、布局和元素进行精准解析及结构化处理,从数据源头降低大模型“幻觉”风险,让大模型在与人类的沟通中“更靠谱”。1Ps28资讯网——每日最新资讯28at.com

1Ps28资讯网——每日最新资讯28at.com

图说:“大模型加速器 2.0”文档解析引擎助力知识库理解手写笔记示意图1Ps28资讯网——每日最新资讯28at.com

据悉,升级后的“大模型加速器”在复杂版面理解、表格及图表处理、内容溯源等能力上实现新突破,可精准识别上千种文档中的跨页表格、合并单元格、密集表格、手写字符及公式,解析稳定率达99.99%,单页处理耗时较行业可比产品降低超30%;可“逆还原”十余种专业图表数据,并将其转化为大模型可理解的结构化数据。此外,“大模型加速器 2.0”版本新增知识库系列开源组件,助力医疗、制造、教育等行业开发者构建个性化的知识库。1Ps28资讯网——每日最新资讯28at.com

文档解析技术助力教育大模型建设1Ps28资讯网——每日最新资讯28at.com

大模型需要不断“吸收”正确的专业知识,才能应对实际应用问题。合合信息技术团队成员表示,在处理年报、论文、实验室报告等专业文档的过程中,一个符号的解析失误,便可能“误导”大模型,得出与事实相悖的结论。可信性的缺失,也制约了大模型在实际应用场景中的纵深拓展。1Ps28资讯网——每日最新资讯28at.com

赛尔教育科技发展有限公司(简称“赛尔教育”)系“中国教育和科研计算机网CERNET”的运营公司赛尔网络的重要子公司,是教育国际化、教育信息化、数字化教育方案的提供商。赛尔教育CTO、教育数字化事业部总经理杨林提到,教育行业中所涉及的文档格式多样,在内容上也包含了表格、公式、手写字符、多语言文字等信息。如何高效准确地提取各类文档中的文本信息,并非易事。1Ps28资讯网——每日最新资讯28at.com

“教育行业的大模型建设工作中,数据的数量和质量起着决定性作用。我们做了很多尝试,模型的速度和准确性都达不到要求,严重影响科研工作的进展。”杨林表示,行业知识库的构建基于大量文档的文本信息提取,需要高效率、高准确率的工具。合合信息文档解析技术提供了专业的技术支持和服务,有效解决了文档处理过程中的问题。1Ps28资讯网——每日最新资讯28at.com

在“大模型加速器”的支持下,合合信息与赛尔教育共同协作,提升大模型对复杂版面、元素的“理解力”,使其按照人类正常的阅读顺序识别文档结构,智能划分标题、段落、表格和图表等内容块,帮助大模型理解版面、内容间的对应关系,减少AI“幻觉”现象。1Ps28资讯网——每日最新资讯28at.com

1Ps28资讯网——每日最新资讯28at.com

图说:图表解析模块将图表还原为表格数据1Ps28资讯网——每日最新资讯28at.com

除了复杂的版面布局,种类繁多、空间结构复杂的图表元素也是解析难点所在。“大模型加速器2.0”图表解析模块可智能提取多种图表中的关键数据点、坐标轴信息、图例说明等,在精准解析不同类型图表数据的基础上,将其还原为一组完整的Excel表格数据,作用于教育行业大模型微调,学科知识库建设、智能审阅等环节。1Ps28资讯网——每日最新资讯28at.com

智能溯源让大模型用得更“安心”1Ps28资讯网——每日最新资讯28at.com

近期,多家券商机构纷纷宣布接入大模型,帮助分析师、行业研究员等专业人士提高工作效率。为帮助用户简化专业文档数据筛选和数据抽取流程,提升文档内容解读效率与准确率,“大模型加速器 2.0” 上线了知识库产品组件,支持复杂文档的智能问答、总结与检索。1Ps28资讯网——每日最新资讯28at.com

为了让行业“安心”使用大模型,知识库产品推出溯源功能,通过在“投喂”给知识库的Markdown及JSON文件中标记页码、坐标等空间位置信息,实现对句子、段落的精确溯源,为用户提供了一个快速检验的路径。以财务分析为例,大模型在多份高达上千页的财报文件中找到收入、利润等关键数据后,券商分析师可利用溯源功能定位原表格,对信息进行复核,防止错误、遗漏。1Ps28资讯网——每日最新资讯28at.com

1Ps28资讯网——每日最新资讯28at.com

图说:知识库对财报数据所在表格进行精准溯源1Ps28资讯网——每日最新资讯28at.com

目前,知识库组件已面向开发者开源,帮助其根据自身需要快速构建个性化行业知识库。此前,合合信息已开源智能文档处理“百宝箱”系列产品,解决文档解析精度低、解析效果评估难等问题,开发者可根据研发需求灵活搭配使用。未来,“大模型加速器”将持续优化迭代,助力大模型在各行各业中“百花齐放”。1Ps28资讯网——每日最新资讯28at.com

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!1Ps28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-20-138484-0.html合合信息TextIn发布“大模型加速器2.0”,文档单页处理耗时降低超30%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 2025 AWE海信璀璨精彩绽放,四款产品荣膺艾普兰奖诠释东方美学新高度

下一篇: 润和软件亮相华为中国合作伙伴大会2025,发布DeepSeek一体机,引领行业大模型敏捷落地

标签:
  • 热门焦点
  • 6月iOS设备性能榜:M2稳居榜首 A系列只能等一手3nm来救

    没有新品发布,自然iOS设备性能榜的上榜设备就没有什么更替,仅仅只有跑分变化而产生的排名变动,毕竟苹果新品的发布节奏就是这样的,一年下来也就几个移动端新品,不会像安卓厂商,一
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 消费结构调整丨巨头低价博弈,拼多多还卷得动吗?

    来源:征探财经作者:陈香羽随着流量红利的退潮,电商的存量博弈越来越明显。曾经主攻中高端与品质的淘宝天猫、京东重拾“低价”口号。而过去与他们错位竞争的拼多多,靠
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 华为HarmonyOS 4升级计划公布:首批34款机型今日开启公测

    8月4日消息,今天下午华为正式发布了HarmonyOS 4系统,在更流畅的前提下,还带来了不少新功能,UI设计也有变化,会让手机焕然一新。华为宣布,首批机型将会在
  • OPPO K11评测:旗舰级IMX890加持 2000元档最强影像手机

    【Techweb评测】中端机型用户群体巨大,占了中国目前手机市场的大头,一直以来都是各手机品牌的“必争之地”,其中OPPO K系列机型一直以来都以高品质、
  • 2022爆款:ROG魔霸6 冰川散热系统持续护航

    喜逢开学季,各大商家开始推出自己的新产品,进行打折促销活动。对于忠实的端游爱好者来说,能够拥有一款梦寐以求的笔记本电脑是一件十分开心的事。但是现在的
  • 华为举行春季智慧办公新品发布会 首次推出电子墨水屏平板

    北京时间2月27日晚,华为在巴塞罗那举行春季智慧办公新品发布会,在海外市场推出之前已经在中国市场上市的笔记本、平板、激光打印机等办公产品,并首次推出搭载
Top