当前位置:首页 > 元宇宙 > AI

百度发布新一代文字识别 AI 模型 PP-OCRv5:仅 0.07B,部分测试超 GPT-4o

来源: 责编: 时间:2025-09-16 16:49:04 90观看
导读 IT 之家 9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。百度介绍称,PP-OCRv5 是一个为缓解大型视觉语言模型(VLMs)局限性而设计的专用 OCR 模型,它提供了一种高效、准确

IT 之家 9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。bc228资讯网——每日最新资讯28at.com

百度介绍称,PP-OCRv5 是一个为缓解大型视觉语言模型(VLMs)局限性而设计的专用 OCR 模型,它提供了一种高效、准确且轻量级的解决方案。bc228资讯网——每日最新资讯28at.com

PP-OCRv5 通过保持模块化、两阶段的流程,专门针对高速、精确的文本检测和识别,解决了大型 VLMs 的精确文本定位和边界框精度局限性问题。bc228资讯网——每日最新资讯28at.com

PP-OCRv5 的亮点如下:bc228资讯网——每日最新资讯28at.com

效率:该模型参数量仅为 0.07B,能够在 CPU 和边缘设备上实现更高性能,其移动版本在英特尔 Xeon Gold 6271C CPU 上每秒可处理超过 370 个字符。bc228资讯网——每日最新资讯28at.com

性能:PP-OCRv5 在 OCR 特定基准测试中优于通用型 VLM 模型,如 Gemini 2.5 Pro、Qwen2.5-VL 和 GPT-4o,包括手写和印刷的中英文以及拼音文本。bc228资讯网——每日最新资讯28at.com

定位:PP-OCRv5 旨在提供精确的文本行边界框坐标,这对于结构化数据提取和内容分析是关键要求。bc228资讯网——每日最新资讯28at.com

多语言支持:该模型支持五种文字类型 —— 简体中文、繁体中文、英文、日文和拼音,并能识别超过 40 种语言。bc228资讯网——每日最新资讯28at.com

bc228资讯网——每日最新资讯28at.com

PP-OCRv5 由四个核心组件构成:bc228资讯网——每日最新资讯28at.com

图像预处理:处理图像的旋转和畸变,以标准化输入。bc228资讯网——每日最新资讯28at.com

文本检测:识别图像中文本行的精确位置。bc228资讯网——每日最新资讯28at.com

文本行方向:分类检测到的文本方向,以确保其正确对齐以进行识别。bc228资讯网——每日最新资讯28at.com

文本识别:将每行文本中的字符解码为文本字符串。bc228资讯网——每日最新资讯28at.com

bc228资讯网——每日最新资讯28at.com

IT 之家附 PP-OCRv5 下载地址如下:bc228资讯网——每日最新资讯28at.com

https://huggingface.co/collections/PaddlePaddle/pp-ocrv5-684a5356aef5b4b1d7b85e4bbc228资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-27580-0.html百度发布新一代文字识别 AI 模型 PP-OCRv5:仅 0.07B,部分测试超 GPT-4o

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 北京:1400 多所中小学已开设人工智能通识课,每学年不少于 8 个课时

下一篇: OpenAI 奥尔特曼称 AI 给自己带来重压:ChatGPT 上线后就没睡过一个好觉

标签:
  • 热门焦点
  • 风口已至,多领域平台融入社交元素!

    在众多领域平台中,社交元素都扮演着重要角色,如直播营销带货、线上配对听歌、游戏局内互动等。随着元宇宙时代的来临,社交产品不断升级,社交元素推动流量变现,多平台领域融入社交
  • 上、中、下游加深融合,搭建元宇宙产业全景

    元宇宙产业链涉及多种技术和多个领域。在上游,聚集着大量的技术厂商,提供元宇宙相关的硬件和软件支持;在中游,内容运营与分发领域也吸引着越来越多的企业以VR内容
  • 元宇宙是投资中国的第五次重大机遇

    作者为凯思博投资董事长导语:投资逻辑要来自于人性在社会发展过程中的普遍规律,由第一性原理出发找出重大的投资机会来。1978年的改革开放到今天,中国总共经历了
  • 搭上“谷爱凌”,“柳夜熙们”站上风口?

    作者:张琳 曹杨从“永不塌房”的艺人到频频亮相北京冬奥会,作为元宇宙细分赛道之一的虚拟数字人又火了一把。2月7日,即谷爱凌摘得冬奥会自由式滑雪大跳台金牌的
  • 吸金31亿美元,谁在催火2021年的链游?

    2021年究竟发生了什么,才使得链游领域在这年一飞冲天?作者:廖羽2022年2月16日,Invest Game发布《2021年全球游戏投资报告》,报告显示,游戏行业的投资重点正在向区块
  • 下一个黄金赛道?NFT的碎片化!

    碎片化可能是我们一生中最重要的一个投资趋势,碎片化本身并不新鲜。它已经存在了400年之久。早在1602年,荷兰东印度公司是历史上第一家在公共证券交易所上市的公
  • 如何在元宇宙中建立品牌忠诚度

    Snoop Dogg、耐克、苏富比和普华永道都有什么共同点?他们都投资于元宇宙的房地产。除了我们在屏幕上看到的二维世界--手机、笔记本电脑、台式机或iPad--他们决
  • 知名艺术家打造去中心化“好莱坞”:一部电影一个DAO

    根据市场追踪网站 DappRadar 的数据,随着 NFT 的“出圈”与加密货币的普及,NFT 市场在 2021 年的销售额达到约 250 亿美元,而 2020 年仅为 9490 万美元,同比增超 2
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
Top