当前位置:首页 > 科技  > 软件

理光荣获 2024 年度国际文档分析与识别会议(ICDAR)官方赛事两项冠军

来源: 责编: 时间:2024-09-10 09:38:51 230观看
导读 2024 年 8 月 30 日至 9 月 4 日,国际文档分析与识别会议 International Conference on Document Analysis and Recognition (以下简称 ICDAR) 在希腊雅典举行。今年 ICDAR 设立了十余项竞赛,吸引了全球诸多知

2024 年 8 月 30 日至 9 月 4 日,国际文档分析与识别会议 International Conference on Document Analysis and Recognition (以下简称 ICDAR) 在希腊雅典举行。今年 ICDAR 设立了十余项竞赛,吸引了全球诸多知名科技公司和研究机构的参与。理光中国研究院 NLP 团队在 ICDAR 官方比赛“通过 Aria 眼镜阅读文档 (Reading Documents Through Aria Glasses)”赛道上,斩获“低分辨率下的单词识别”及“页面级别的识别与阅读”两项任务的冠军。9h528资讯网——每日最新资讯28at.com

9h528资讯网——每日最新资讯28at.com

*“页面级别的识别与阅读”任务冠军奖状9h528资讯网——每日最新资讯28at.com

ICDAR 赛事介绍9h528资讯网——每日最新资讯28at.com

ICDAR 由国际模式识别协会 IAPR (International Association of Pattern Recognition) 举办,是模式识别、计算机视觉领域、图像处理领域最为重要的国际学术会议之一,涵盖了文档分析与识别领域的最新学术成果和前沿应用发展趋势。9h528资讯网——每日最新资讯28at.com

“通过 Aria 眼镜阅读文档 (Reading Documents Through Aria Glasses)”赛道,涉及到理解和处理使用 Aria 设备 * 采集到的文本内容。任务目标是开发一系列稳健的图像处理算法来识别整个页面中的文字内容,同时保持正确的阅读顺序。具体来说,包括以下两个子过程:1) 低分辨率下的单词识别: 检测并识别来自 Aria 眼镜采集图像中的单词文本;2) 阅读顺序预测: 预测从页面中提取的单词级文本的阅读顺序 (即页面上单词的序列)。9h528资讯网——每日最新资讯28at.com

9h528资讯网——每日最新资讯28at.com

*ICDAR 会场上,主办方介绍任务数据示例9h528资讯网——每日最新资讯28at.com

9h528资讯网——每日最新资讯28at.com

*ICDAR 会场上,主办方介绍任务目标与挑战9h528资讯网——每日最新资讯28at.com

理光的突破创新与应用实践9h528资讯网——每日最新资讯28at.com

理解文档是可穿戴人工智能系统的基本任务,需要开发解决方案,赋予系统阅读和理解文档中知识的能力。除了传统的文档分析挑战外,可穿戴设备图像还受到人体姿势的多样性、不同的光照条件、潜在的障碍物以及其他场景中主体的影响,这些因素在获取准确的光学字符识别 (OCR) 时增加了额外的障碍。9h528资讯网——每日最新资讯28at.com

理光中国研究院将自身各种技术积累有机结合,在单词识别部分,搭建了以 PARSeq (Permuted AutoRegressive Sequence) 为基础的模型,采用了创新的模型迭代训练方法和成熟的数据合成技术,进一步提高了识别性能。在阅读顺序预测部分,理光没有将其定义为传统的排序任务或翻译任务,而是建模为具备语义分割能力的布局解析任务。基于在表格识别和图纸识别项目上的丰富经验,理光自研的语义分割框架,在任务数据上微调后,展现了优秀的解析效果。9h528资讯网——每日最新资讯28at.com

理光中国研究院在 OCR 技术研究和各种场景下的项目实践经验方面有着深刻的理解。在基础技术研究方面,理光中国研究院一直致力于图像处理、文本检测、文本识别、布局分析、表格识别以及与文档理解相关的其他技术的研究,并取得了领先成果。在应用方面,理光中国研究院已成功将 OCR 技术适配到设计图纸、财务报告、合同、票据以及传统文档以外的其他领域。这些解决方案已经成功服务于多领域客户,并在特定需要的定制化适配方面积累了丰富的经验。9h528资讯网——每日最新资讯28at.com

图纸档案数字化解决方案,可以实现扫描件表格文字识别,信息提取和比对,以及归档流程处理的自动化,有效解决海量图纸数字化过程中大量的信息查找,手动录入,人工审核,繁琐归档的难题,实现了高效智能的图纸数字化管理,90% 以上流程实现自动化。9h528资讯网——每日最新资讯28at.com

财务文档数字化解决方案,可以实现各类财报文档自动识别,关键数据提取录入与结构化,同时配合金融领域风险评估模型,极大程度地提高了金融风险识别的效率和准确率。9h528资讯网——每日最新资讯28at.com

合同比对解决方案,可以进行合同文档比对,将电子文档,扫描件等不同版本的合同文档进行智能分析比对,检测包含范本使用,文本修改,字符标点等各类差异,极大提高比对效率并控制风险。9h528资讯网——每日最新资讯28at.com

合同审阅解决方案,可以对印章和关键内容进行识别和审阅: 自动识别印章错盖漏盖,智能提取合同关键信息 (例如合同主体,金额,时间,特殊条款等内容), 提高复核,审批,以及自动化归档管理效率。9h528资讯网——每日最新资讯28at.com

理光将继续秉承创新精神,不断深化技术研究,拓展 OCR 技术的应用领域,以满足不断变化的市场需求。我们期待与更多的合作伙伴携手,将我们的技术应用于更广泛的行业和场景中,共同推动人工智能技术的进步。同时,我们也将持续关注客户的需求,通过不断的优化和创新,提供更加精准、高效的解决方案,以帮助客户解决实际问题,提升工作效率。9h528资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-112573-0.html理光荣获 2024 年度国际文档分析与识别会议(ICDAR)官方赛事两项冠军

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: TCL 实业荣获 IFA2024 多项大奖,展示全球科技创新力量

下一篇: 知情人士称智己汽车员工社媒开号系自愿,已向部分出刊媒体发送律师函

标签:
  • 热门焦点
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 拼多多APP上线本地生活入口,群雄逐鹿万亿市场

    Tech星球(微信ID:tech618)文 | 陈桥辉 Tech星球独家获悉,拼多多在其APP内上线了“本地生活”入口,位置较深,位于首页的“充值中心”内,目前主要售卖美食相关的
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 信通院:小米、华为等11家应用商店基本完成APP签名及验签工作

    中国信通院表示,目前,小米、华为、OPPO、vivo、360手机助手、百度手机助手、应用宝、豌豆荚和努比亚等9家应用商店,以及抖音和快手2家新型应用分发平
  • 超级标准版旗舰!iQOO 11S全球首发iQOO超算独显芯片

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
Top