当前位置:首页 > 科技  > 网络

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星

来源: 责编: 时间:2024-07-24 14:49:32 605观看
导读 离大谱!!不看视频完整版谁知道里面的美少女竟是一位大叔。好嘛,原来这是用了快手可灵团队的可控人像视频生成框架——LivePortrait。LivePortrait开源即爆火,短短时间已在GitHub狂揽7.5K星标。还引来

离大谱!!不看视频完整版谁知道里面的美少女竟是一位大叔。zUb28资讯网——每日最新资讯28at.com

好嘛,原来这是用了快手可灵团队的可控人像视频生成框架——LivePortrait。zUb28资讯网——每日最新资讯28at.com

LivePortrait开源即爆火,短短时间已在GitHub狂揽7.5K星标。zUb28资讯网——每日最新资讯28at.com

还引来HuggingFace首席战略官Thomas Wolf亲自体验:zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

甚至目前仍在HuggingFace全部应用里排在趋势第一zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

所以,为啥LivePortrait能够疯狂引人关注?zUb28资讯网——每日最新资讯28at.com

还得从它让人眼前一亮的表现说起……zUb28资讯网——每日最新资讯28at.com

让表情“移花接木”zUb28资讯网——每日最新资讯28at.com

LivePortrait由快手可灵大模型团队开源,只需1张原图就能生成动态视频。zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

先来看一组官方输出。zUb28资讯网——每日最新资讯28at.com

简单的开始,丢一张静态图像,LivePortrait可以让肖像眨眼、微笑或转头。zUb28资讯网——每日最新资讯28at.com

还可以施展“移花接木”,也就是将表情、动态等复制到其他人身上,还是不限风格(写实、油画、雕塑、3D渲染)和尺寸那种~zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

当然了,这种“魔法”不限于单人,搞个全家福也不是不行。[doge]zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

除了从静态图→视频,我们还可以让一个或多个视频实现“笑容增加术”。zUb28资讯网——每日最新资讯28at.com

比如提供一段宝宝没有表情的视频(右侧),我们可以让宝宝按照参照视频wink或微笑。zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

对了,不仅限于人物肖像,小猫小狗也能开始撒娇卖萌了。zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

总之,LivePortrait可以实现人物表情精确控制,比如嘴角上扬的弧度,双眼放大程度都能开启自选。zUb28资讯网——每日最新资讯28at.com

举个栗子,下面这两个是不同参数设置下,人物眼睛大小的变化:zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

看来小说里的“三分凉薄,三分讥笑,四分漫不经心”也不是不能实现。[doge]zUb28资讯网——每日最新资讯28at.com

看完这些不知道你有没有心动,反正网友们整活儿的心是挡不住了。zUb28资讯网——每日最新资讯28at.com

比如配个灯光花式扮鬼脸,有恐怖片那味儿了:zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

再比如实时化身二刺猿:zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

看完这些例子,接下来我们挖一挖背后的技术原理。zUb28资讯网——每日最新资讯28at.com

爆火开源框架zUb28资讯网——每日最新资讯28at.com

和当前主流基于扩散模型的方法不同,LivePortrait探索和扩展了基于隐式关键点的框架的潜力。zUb28资讯网——每日最新资讯28at.com

具体而言,LivePortrait不依赖于图像中明确可见的标记或特征点,而是通过学习数据集中的模式来隐式地推断出关键点的位置。zUb28资讯网——每日最新资讯28at.com

在此基础上,LivePortrait通过两个阶段从头开始训练模型。zUb28资讯网——每日最新资讯28at.com

先说第一阶段,LivePortrait对基于隐式点的框架(如Face Vid2vid),做了一系列改进。zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

这些改进包括高质量数据整理、混合图像和视频训练、升级网络架构、可扩展运动变换、地标引导的隐式关键点优化以及级联损失项的应用等。zUb28资讯网——每日最新资讯28at.com

有了这些,模型的泛化能力、表达能力和纹理质量都能进一步提升。zUb28资讯网——每日最新资讯28at.com

再说第二阶段,通过贴合模块和重定向模块的训练,模型能够更精确地处理面部表情的细节。zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

贴合模块通过跨身份动作训练增强泛化性,估计表情变化并优化关键点。zUb28资讯网——每日最新资讯28at.com

眼部和嘴部重定向模块则分别处理眼部和嘴部的变形变化,通过独立的目标函数计算像素一致性和正则损失,提升模型在复杂表情处理上的灵活性和精确度。zUb28资讯网——每日最新资讯28at.com

那么,LivePortrait具体表现如何呢?zUb28资讯网——每日最新资讯28at.com

研究显示,在同身份驱动对比结果中,与已有方法相比,LivePortrait具有较好的生成质量和驱动精确度,可以捕捉驱动帧的眼部和嘴部细微表情,同时保有参考图片的纹理和身份。zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

且在跨身份驱动对比结果中同样表现较好,虽然在生成质量上略弱于基于扩散模型的方法AniPortrait。但与后者相比,LivePortrait具有极快的推理效率且需要较少的FLOPs。zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com

总之,在RTX 4090 GPU上,LivePortrait的生成速度达到了每帧12.8毫秒,显著高于现有的扩散模型方法。zUb28资讯网——每日最新资讯28at.com

One More ThingzUb28资讯网——每日最新资讯28at.com

补一条官方新预告:可灵AI即将在全球范围内推出其服务。zUb28资讯网——每日最新资讯28at.com

Sora还没来,可灵这回倒是先走出去了~zUb28资讯网——每日最新资讯28at.com

快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星zUb28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-103103-0.html快手可灵团队新开源项目火了:大叔实时变身少女 GitHub狂揽7.5K星

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 宗馥莉凭什么回宫 满手筹码、一点软肋

下一篇: 日本北海道老年盗窃团被捕:88岁、70岁和69岁

标签:
  • 热门焦点
  • 红魔电竞平板评测:大屏幕硬实力

    前言:三年的疫情因为要上网课的原因激活了平板市场,如今网课的时代已经过去,大家的生活都恢复到了正轨,这也就意味着,真正考验平板电脑生存的环境来了。也就是面对着这种残酷的
  • Golang 中的 io 包详解:组合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是对Reader和Writer接口的组合,
  • 一篇文章带你了解 CSS 属性选择器

    属性选择器对带有指定属性的 HTML 元素设置样式。可以为拥有指定属性的 HTML 元素设置样式,而不仅限于 class 和 id 属性。一、了解属性选择器CSS属性选择器提供了一种简单而
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 认真聊聊东方甄选:如何告别低垂的果实

    来源:山核桃作者:财经无忌爆火一年后,俞敏洪和他的东方甄选依旧是颇受外界关心的“网红”。7月5日至9日,为期5天的东方甄选“甘肃行”首次在自有App内直播,
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • 消息称小米汽车开始筛选交付中心:需至少120个车位

    IT之家 7 月 7 日消息,日前,有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者 发文表示,据经销商集团反馈,小米汽车目前
  • AMD的AI芯片转单给三星可能性不大 与台积电已合作至2nm制程

    据 DIGITIMES 消息,英伟达 AI GPU 出货逐季飙升,接下来 AMD MI 300 系列将在第 4 季底量产。而半导体业内人士表示,近日传出 AMD 的 AI 芯片将转单给
  • 2299元起!iQOO Pad明晚首销:性能最强天玑平板

    5月23日,iQOO如期举行了新品发布会,除了首发安卓最强旗舰处理器的iQOO Neo8系列新机外,还在发布会上推出了旗下首款平板电脑——iQOO Pad,其最大的卖点
Top