当前位置:首页 > 元宇宙 > AI

几何纹理重建新 SOTA!浙大提出 SIFU:单图即可重建高质量 3D 人体模型

来源: 责编: 时间:2024-01-23 08:42:22 409观看
导读 【新智元导读】最近来自浙江大学 ReLER 实验室的研究人员提出 SIFU 模型,一种侧视图条件隐函数模型用于单张图片 3D 人体重建。模型通过引入人体侧视图作为先验条件,并结合扩散模型进行纹理增强,在几何与纹理重

【新智元导读】最近来自浙江大学 ReLER 实验室的研究人员提出 SIFU 模型,一种侧视图条件隐函数模型用于单张图片 3D 人体重建。模型通过引入人体侧视图作为先验条件,并结合扩散模型进行纹理增强,在几何与纹理重建测试中均达到 SOTA,并且在真实世界中具有多种应用场景。QtS28资讯网——每日最新资讯28at.com

在 AR、VR、3D 打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体 3D 模型非常重要。QtS28资讯网——每日最新资讯28at.com

传统的方法创建这些模型不仅需要大量时间,还需要能够捕捉多视角照片的专业设备,此外还依赖于技术熟练的专业人员。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

▲SIFU 重建 3D 人体模型用于场景搭建

与此相反,在日常生活中,我们最常见的是通过手机相机拍摄的或在各种网页上找到的人像照片。QtS28资讯网——每日最新资讯28at.com

因此,一种能从单张图像准确重建 3D 人体模型的方法可以显著降低成本,并简化独立创作的过程。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

▲以往方法(左)与本文方法技术路线比较(右)

以往的深度学习模型用于 3D 人体重建,往往需要经过三个步骤:从图像中提取 2D 特征,将 2D 特征转到 3D 空间,以及 3D 特征用于人体重建。QtS28资讯网——每日最新资讯28at.com

然而这些方法在 2D 特征转换到 3D 空间的阶段,往往忽略了人体先验的引入,导致特征的提取不够充分,最终重建结果上会出现各种缺陷。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

▲SIFU 与其他 SOTA 模型重建效果比较

此外,在对纹理预测的阶段,以往模型仅仅依靠训练集中学得的知识,缺少真实世界的先验知识,也往往导致不可见区域的纹理预测较差。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

▲SIFU 在纹理预测阶段引入先验知识,增强不可见区域(背部等)的纹理效果。

对此,来自浙江大学 ReLER 实验室的研究人员提出 SIFU 模型,依靠侧视图条件隐函数从单张图片重建 3D 人体模型。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

论文地址:https://arxiv.org/ abs / 2312.06704QtS28资讯网——每日最新资讯28at.com

项目地址:https://github.com/ River-Zhang / SIFUQtS28资讯网——每日最新资讯28at.com

该模型通过在 2D 特征转换到 3D 空间引入人体侧视图作为先验条件,增强几何重建效果。并在纹理优化阶段引入预训练的扩散模型,来解决不可见区域纹理较差的问题。QtS28资讯网——每日最新资讯28at.com

模型结构

模型 pipeline 如下:QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

该模型运行可分为两个阶段,第一阶段借助侧隐式函数重建人体的几何(mesh)与粗糙的纹理(coarse texture),第二阶段则借助预训练的扩散模型对纹理进行精细化。QtS28资讯网——每日最新资讯28at.com

在第一阶段中,作者设计了一种独特的 Side-view Decoupling Transformer,通过 global encoder 提取 2D 特征后,在 decoder 中引入了人体先验模型 SMPL-X 的侧视图作为 query,从而在图像 2D 特征中解耦出人体不同方向的 3D 特征(前后左右),最后用于重建。QtS28资讯网——每日最新资讯28at.com

该方法成功的在 2D 特征转换到 3D 空间时结合人体先验知识,从而使得模型有更好的重建效果。QtS28资讯网——每日最新资讯28at.com

在第二阶段,作者提出一种 3D 一致性纹理优化流程(3D Consistent Texture Refinement),首先将人体不可见的区域(侧面、背面)可微渲染成视角连续的图片集,再借助在海量数据中学习到先验知识的扩散模型,对粗糙纹理图片进行一致性编辑,得到更精细的结果。最后通过精细化前后的图片计算损失来优化 3D 模型的纹理贴图。QtS28资讯网——每日最新资讯28at.com

实验部分

更高的重建精度QtS28资讯网——每日最新资讯28at.com

在实验部分,作者使用全面多样化的测试集对他们的模型进行测试,包括 CAPE-NFP、CAPE-FP 和 THuman2.0,并与以往发表在各大顶会的单张图片人体重建 SOTA 模型进行比较。经定量测试,SIFU 模型在几何重建与纹理重建中均表现出了最好的效果。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

定量评估几何重建精度QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

定量评估纹理重建效果QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

使用互联网中公开图片作为输入进行定性效果展示QtS28资讯网——每日最新资讯28at.com

更强的鲁棒性QtS28资讯网——每日最新资讯28at.com

以往的模型应用训练集以外的数据时,由于估计的人体先验模型 SMPL / SMPL-X 不够准确,往往导致重建结果与输入图片相差甚远,难以投入实际应用。QtS28资讯网——每日最新资讯28at.com

对此,作者专门对模型的鲁棒性进行了测试,通过在 ground truth 先验模型参数中加入扰动使其位姿发生偏移,模拟真实场景中 SMPL-X 估计不准确的情况,来评估模型重建的精度。结果表明 SIFU 模型在该情况下,依然具有最好的重建精度。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

评估模型面对有误差的人体先验模型时的鲁棒性QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

使用真实世界中的图片,在先验人体模型估计不准确的情况下,SIFU 依然有较好的重建效果QtS28资讯网——每日最新资讯28at.com

更广阔的应用场景QtS28资讯网——每日最新资讯28at.com

SIFU 模型的高精度高质量重建效果,使得其具有丰富的应用场景,包括 3D 打印、场景搭建、纹理编辑等。QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

3D 打印 SIFU 重建的人体模型QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

SIFU 借助扩散模型进行纹理编辑QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

SIFU 用于 3D 场景搭建QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

更多定性测试结果(测试输入图片均来自互联网)QtS28资讯网——每日最新资讯28at.com

QtS28资讯网——每日最新资讯28at.com

借助公开动作序列数据,可对 SIFU 重建的模型进行驱动QtS28资讯网——每日最新资讯28at.com

总结

本文提出侧视图条件隐式函数和 3D 一致性纹理编辑方法,弥补了以往工作在 2D 特征转换到 3D 空间、纹理预测时对先验知识引入的不足,极大地提高了单张图片人体重建的精度和效果,使模型在真实世界应用中具有显著的优势,也为该领域未来的研究提供了新的思路。QtS28资讯网——每日最新资讯28at.com

参考资料:QtS28资讯网——每日最新资讯28at.com

https://arxiv.org/abs/2312.06704QtS28资讯网——每日最新资讯28at.com

本文来自微信公众号:新智元 (ID:AI_era)QtS28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-3256-0.html几何纹理重建新 SOTA!浙大提出 SIFU:单图即可重建高质量 3D 人体模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微软推出独立 AI 工具“阅读教练”,辅助提高学习者阅读能力

下一篇: TikTok 内测 AI 生成歌曲功能:用户只需输入歌词文本,可自选曲风

标签:
  • 热门焦点
  • ChatGPT访问量增速下滑,AI真的是一场泡沫吗?

    来源:首席商业评论2023年,最火的莫过于ChatGPT,席卷全球的同时也引发了生成式AI(人工智能)的投资热潮。在美股,ChatGPT相关概念股飙涨,以AI算力龙头英伟达为例,其股价年内一度累计上
  • 人间诚实周鸿祎:360 All in 大模型的六个解读

    主笔 / 村口有牛文章架构师 / 毛自聪出品 / 巨头财经5月至今,人间躁动,各路大模型你方唱罢我登场,VC圈互联网圈媒体圈已近癫狂。谁也没想到,今日,360再度刷屏,老牌互联网巨头展现
  • FMIFAwards奖项即将揭晓!

    来源:X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
  • 刷完一场元宇宙世界杯音乐盛典,我爽了

    作者|刘小土编辑|李春晖你有多久没完整追过一场音乐盛典了?三刷都不嫌多的那种。按照惯例,每逢年底,直播、长短视频、音乐平台便会抢着端上来几场音乐盛典。搁以
  • 【申万宏源】必然的碎片化AI落地,哪种路径可能胜出? | 元宇宙Meta洞见

    大规模预训GPT(Generative PreTraining)是OpenAI在2018年提出的模型,大规模预训练模型(大模型)渐渐成为了AI算法领域的热点。AI产业链:从算力到应用工作流程视角•
  • 中国虚拟数字人如何横向拓展市场需求,探索发展场景?

    通过5G、AI等新技术更新换代,虚拟数字人为诸多下游行业带来新的发展机会。虚拟数字人技术以其简化性和精品性持续拓展泛娱乐、金融、教育、政务、医疗、零售等
  • 好莱坞:一股新的电影制作加密浪潮将颠覆这个行业

    在Moviecoin.com平台上,有一部电影设定了一个前所未有的目标,即通过预售NFT获得100%的全额融资,这部电影就是马克·奥康纳(Mark O’connor)执导的《Oui Cannes》,
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • 这场虚拟发布会,当面“造假”!

    英伟达去年4月份那场发布会,你曾看出什么不对劲的地方吗?你品,你细品——在计算机图形学顶会SIGGRAPH 2021上,英伟达通过一部纪录片自曝:那场发布会内藏玄机~你看到
Top