当前位置:首页 > 科技  > 知识百科

谷歌公布13GB 3D扫描数据集:17大类、1030个家用物品

来源: 责编: 时间:2023-08-07 16:30:17 333观看
导读 近年来,深度学习技术使得计算机视觉和机器人领域的许多进展成为可能,但训练深度模型需要各种各样的输入,以泛化到新的场景。此前,计算机视觉领域已经利用网页抓取技术收集了数百

1EM28资讯网——每日最新资讯28at.com

近年来,深度学习技术使得计算机视觉和机器人领域的许多进展成为可能,但训练深度模型需要各种各样的输入,以泛化到新的场景。1EM28资讯网——每日最新资讯28at.com

此前,计算机视觉领域已经利用网页抓取技术收集了数百万个主题的数据集,包括 ImageNet、Open Image、Youtube-8M、COCO 等。然而,给这些数据集贴标签仍是一个劳动密集型工作,标签错误可能会影响到对技术进步的感知,而且这种策略也很难推广至 3D 或真实世界的机器人数据上。与图像不同的是,目前网络上并没有大规模、高质量的 3D 场景,而从真实世界收集这类数据又极具挑战性。此外,人工标注员也很难从图像中提取 3D 几何特性。1EM28资讯网——每日最新资讯28at.com

一般来说,使用 Gazebo、Bullet、MuJoCo、Unity 等工具对机器人和环境进行仿真可以减轻上述限制。但是,仿真毕竟不完全是真实世界,即使一个场景是直接通过对真实环境的 3D 扫描建立起来的,扫描中的离散对象也会像固定的背景物一样,不会像真实世界的对象那样对输入做出回应。1EM28资讯网——每日最新资讯28at.com

因此,关键问题在于提供一个高质量的 3D 对象模型库,这些模型可以整合到物理和视觉建模中,为深度学习提供所需的多样性。1EM28资讯网——每日最新资讯28at.com

为了解决这个问题,谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描家用物品组成的精选集,可用于 Ignition Gazebo、Bullet 模拟器和其他可以读取 SDF 模型格式的工具。1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

在一篇论文中,研究者介绍了该数据集的收集、管理、扩展等内容。1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

论文链接:https://arxiv.org/pdf/2204.11918.pdf1EM28资讯网——每日最新资讯28at.com

据不完全统计,GSO 数据集已经在计算机视觉、计算机图形学、机器人操作、机器人导航和 3D 形状处理等 10 个项目的 12 篇论文中得到应用:1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

该研究贡献主要有几点:1EM28资讯网——每日最新资讯28at.com

提出 Google Scanned Objects 数据集;3D 扫描 pipeline 设计;3D 扫描管理和发布过程;该数据集在研究领域中的影响。数据集的创建1EM28资讯网——每日最新资讯28at.com

GSO 数据集起源于 2011 年谷歌的云机器人计划,目的是让机器人基于普通家用物品的高保真 3D 模型,能够在自己的环境中识别和抓取物体。1EM28资讯网——每日最新资讯28at.com

然而,除了物体识别和机器人抓取之外,3D 模型还有很多用途,包括用于物理模拟的场景构建和用于终端用户应用的 3D 物体可视化。因此,谷歌研究院发起了一个项目,将 3D 体验大规模引入谷歌,以低于传统商业级产品摄影的成本收集大量家用物品的 3D 扫描图像。1EM28资讯网——每日最新资讯28at.com

这是一项端到端的工程,包括物体获取、新颖的 3D 扫描硬件、高效的 3D 扫描软件、快速 3D 渲染的质量保障、网络与移动浏览器,以及人机交互研究。1EM28资讯网——每日最新资讯28at.com

在收集数据之后,研究者构建了一个 pipeline,让这些数据能以各种格式使用。1EM28资讯网——每日最新资讯28at.com

3D 扫描 pipeline1EM28资讯网——每日最新资讯28at.com

即使限于家用物品的领域,3D 扫描也会带来独特的挑战,包括高效的物理扫描设置、目标照明、相机可靠性、扫描仪性能、配色、纹理渲染,以及处理光学上不一致的材料,比如近白色、有光泽或透明的表面。1EM28资讯网——每日最新资讯28at.com

专用的 3D 扫描硬件是劳动密集型的,性价比不高。为了进行大规模扫描,还需要一些更具可用性和可靠性的工具。1EM28资讯网——每日最新资讯28at.com

因此,研究者设计了自己的专用扫描硬件和软件(图 2),能够在 10 分钟内扫描物体并生成高分辨率模型。控制光线的物理外壳(图 2b)使用两台机器视觉相机和一台投影仪进行结构光扫描,捕捉 3D 几何图形,并使用单独的单反高分辨率相机以产品友好的光线捕捉纹理。1EM28资讯网——每日最新资讯28at.com

项目第一年结束的时候能够做到每周超过 400 次扫描,过程中,研究团队共获得了 100K 份 360 度照片旋转和 10k 份完全 3D 扫描的独特对象。1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

图 2。1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

图 3:作为校准过程的扫描。(a) 校正模式使 2D pipeline 能够精确对齐相机。(b) 计算机控制的投影仪为 3D 扫描物体创造了类似的图案。(c) 合适的模式能够以亚像素精度探测位置。(d) 提取扫描物体的完整 3D 形状。1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

图 4:扫描的物品需要通过质量检查。(a) 许多物品被捕获为高质量的封闭流形 mesh。(b) 有的物体很少产生无效的 mesh,但有时会出现变形。1EM28资讯网——每日最新资讯28at.com

仿真模型转换1EM28资讯网——每日最新资讯28at.com

这些原始的扫描模型使用协议缓冲元数据、非常高分辨率的可视化、不适合模拟的格式。对象的一些物理属性,比如质量,会被捕获,但诸如摩擦之类的表面属性在元数据中则没有表示。1EM28资讯网——每日最新资讯28at.com

为了让这些扫描的模型能够在仿真系统中使用,每个模型都通过一个 pipeline 进行下列步骤:1EM28资讯网——每日最新资讯28at.com

过滤无效对象。分配对象名称。验证对象 mesh。计算物理属性。构造碰撞体积。减小模型尺寸。创建 SDF 模型。创建缩略图。打包模型。数据集属性组成1EM28资讯网——每日最新资讯28at.com

GSO 数据集包含 1030 个扫描对象和相关的元数据,总计 13GB,根据 CCBY 4.0 License 授权。表 III.1 分解了数据集中的模型类别。1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

表 III.11EM28资讯网——每日最新资讯28at.com

优势1EM28资讯网——每日最新资讯28at.com

自动化 pipeline 可以快速生成大量模型,而无需手工处理。因为这些模型是扫描的,而不是手工建模的,所以它们是真实的,而不是理想中的,这减少了将学习从模拟转移到真实世界的困难。1EM28资讯网——每日最新资讯28at.com

扫描仪的玻璃平台可以从各个方面扫描模型,包括底座,不像其他扫描仪有不透明的平台。类似地,从环境中提取的模型通常缺少像底座这样起到衔接作用的遮挡区域。1EM28资讯网——每日最新资讯28at.com

因为该扫描仪根据投影图案而不是深度照相机数据重建表面形状,所以得到的 mesh 具有高保真度。光滑的表面是平滑的,轮廓边缘是准确的 (图 5)。相比之下,RGB-D 数据得到的 mesh,可能出现斑驳和不规则,特别是在轮廓上。1EM28资讯网——每日最新资讯28at.com

1EM28资讯网——每日最新资讯28at.com

图51EM28资讯网——每日最新资讯28at.com

限制1EM28资讯网——每日最新资讯28at.com

同时,这个数据集也有一些限制:扫描仪的捕捉区域不能容纳比面包箱 (约 50 厘米) 大的对象,因此该数据集不包括在其他数据集中较大的对象,如椅子、汽车或飞机。同样,扫描分辨率是有限的,所以非常小的对象不能以合理的保真度建模。此外,生成的纹理是漫反射的:高度镜面或透明的对象不能表征出来,生成结果也不够理想。1EM28资讯网——每日最新资讯28at.com

更多细节可参考原论文。1EM28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2329-0.html谷歌公布13GB 3D扫描数据集:17大类、1030个家用物品

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 你的AI模型可能有后门!图灵奖得主发53页长文:小心恶意预测

下一篇: 云安全日报220517:IBM MQ消息中间件平台发现执行任意代码漏洞,需要尽快升级

标签:
  • 热门焦点
  • MIX Fold3包装盒泄露 新机本月登场

    小米的全新折叠屏旗舰MIX Fold3将于本月发布,近日该机的真机包装盒在网上泄露。从图上来看,新的MIX Fold3包装盒在外观设计方面延续了之前的方案,变化不大,这也是目前小米旗舰
  • 6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月份有一个618,虽然这是京东周年庆的日子,但别的电商也都不约而同的跟进了,反正促销没坏处,厂商和用户都能满意。618期间一些产品也出现了历史低价,那么各个价位段的产品性价比
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 2023年,我眼中的字节跳动

    此时此刻(2023年7月),字节跳动从未上市,也从未公布过任何官方的上市计划;但是这并不妨碍它成为中国最受关注的互联网公司之一。从2016-17年的抖音强势崛起,到2018年的“头腾
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 自研Exynos回归!三星Galaxy S24系列将提供Exynos和骁龙双版本

    年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,虽同样采用台积电4nm工艺制
  • 微软发布Windows 11新版 引入全新任务栏状态

    近日,微软发布了Windows 11新版,而Build 22563更新主要引入了几周前曝光的平板模式任务栏等,系统更流畅了。更新中,Windows 11加入了专门针对平板优化的任务栏
  • 电博会上海尔智家模拟500平大平层,还原生活空间沉浸式体验

    电博会为了更好地让参展观众真正感受到智能家居的绝妙之处,海尔智家的程传岭先生同样介绍了展会上海尔智家的模拟500平大平层,还原生活空间沉浸式体验。程传
Top