当前位置:首页 > 元宇宙 > 元宇宙

AI绘画的下一站:“AI拍电影” 问世

来源: 责编: 时间:2023-08-11 16:53:39 548观看
导读 当大家还在惊叹和沉浸于AI文本转图像产出的精妙画作的时候,一些闷声做大事的团队已经在人工智能研究上迈向了一个新的领域—文本转视频 9月29日,扎克伯格在facebook上发布了一条关于Make-A-Video人工

当大家还在惊叹和沉浸于AI文本转图像产出的精妙画作的时候,一些闷声做大事的团队已经在人工智能研究上迈向了一个新的领域—文本转视频wAk28资讯网——每日最新资讯28at.com

 wAk28资讯网——每日最新资讯28at.com

9月29日,扎克伯格在facebook上发布了一条关于Make-A-Video人工智能系统的帖子,并附上了一段20s的视频,视频中汇总了Make-A-Video系统通过文本生成视频的一些片段。给Make-A-Video一个文本描述,它就可以为您创建一段视频。wAk28资讯网——每日最新资讯28at.com

 wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

自文本转图像AI技术发布以来,也才过了几个月,人工智能技术就发展成将静态图直接飞升成动态视频了,一句话就能生成视频,不得不说近两年AI发展的速度有点近乎疯狂。wAk28资讯网——每日最新资讯28at.com

不过在Meta发布之后仅一周,谷歌就紧随其后发布了他们在人工智能领域的最新成果Imagen Video和Phenaki两种模型,前者可以生成1280*768分辨率,24帧/秒的高清视频,后者可以将一系列的文本提示生成连贯的长视频。这么看Meta的Make-A-Video还是逊色一点。wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

其实文本生成视频技术并不是什么新鲜事儿,早在今年的6月份,清华&智源研究院就自研了“一句话生成视频”的模型CogVideo,并且将这一模型在gitub上开源了(刚发布不久立马就出圈了)wAk28资讯网——每日最新资讯28at.com

下面我们就一起来了解下这三个团队各自的模型到底如何吧。wAk28资讯网——每日最新资讯28at.com

01

CogVideowAk28资讯网——每日最新资讯28at.com

CogVideo可以生成分辨率为480*480(画质有点渣),4秒(帧数32张)左右的视频,而且在生成真实的对象,以及内容一致性和运动真实性方面的表现相较于当时的其他视频生成AI模型来说都要更好,从下图的我们不难看出这一点,生成的实际人物相关的视频看上去都比较自然和流畅。wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

但是有些地方还是值得再探究下,比如这个狮子正在喝水的视频,CogVideo是直接给狮子加上了一双手,这和我们的常规认知是背道而驰的,仿佛只是把人的手拿水喝这个动作和狮子做了一个拼接。不过在Meta的Make-A-Video生成的视频中也存在类似的情况。wAk28资讯网——每日最新资讯28at.com

那接下来我们就看看Make-A-Video的表现吧!wAk28资讯网——每日最新资讯28at.com

02

Make-A-VideowAk28资讯网——每日最新资讯28at.com

Make-A-Video目前已经实现了下面三个功能wAk28资讯网——每日最新资讯28at.com

  • 文字转视频wAk28资讯网——每日最新资讯28at.com

  • 图片转视频(将一张图片变为动态视频或者将两张图片合成为一个视频)wAk28资讯网——每日最新资讯28at.com

  • 通过原始视频生成视频的变体wAk28资讯网——每日最新资讯28at.com

Meta的官网上也给出了一些的案例。wAk28资讯网——每日最新资讯28at.com

03

Imagen Video & PhenakiwAk28资讯网——每日最新资讯28at.com

首先值得一提的是Imagen Video的清晰度,相比前两个系统生成的视频有了非常大的提升,目前支持生成1280*768分辨率,24帧/秒的视频,下面是官网放出的视频案例效果片段。wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

甚至还能理解3D结构wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

最重要的是 Imagen Video 能够生成各种不同风格的文本动画wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

不过目前谷歌方面表示不会发布 Imagen Video 模型或其源代码,以避免存在模型可能被滥用于制造虚假、仇恨、露骨或有害的内容。wAk28资讯网——每日最新资讯28at.com

通过官网和论文公布的信息可以了解到Phenaki目前可以做到wAk28资讯网——每日最新资讯28at.com

1. 通过不同的描述切换生成的视频风格或切换场景,生成连贯多样化的视频wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

2. 给一个静态的图像作为第一帧+一段文本描述就可以生成一个视频wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

3. 通过一连串的文字描述描述生成2分钟以上的长视频(视频案例请移步Phenaki官网查看:https://phenaki.github.io/#interactive)wAk28资讯网——每日最新资讯28at.com

wAk28资讯网——每日最新资讯28at.com

而且生成的视频还具备故事情节。这样的话,那未来是不是人人都可以通过文本创建视频,就不需要拍摄和剪辑了(惊讶!!!)如果真的能实现,那可能会给视频行业带来翻天覆地的变化。目前Meta和Google团队都暂未提供线上试用入口,有感兴趣的朋友可以去尝试用下CogVideo在线网页看看文字转视频的效果(可点击原文链接跳转):wAk28资讯网——每日最新资讯28at.com

网址:https://huggingface.co/spaces/THUDM/CogVideowAk28资讯网——每日最新资讯28at.com

文字转视频的AI技术在短短的几个月内就已经取得了巨大的进展,似乎每天都有新的突破,难以想象再过几个月这个技术是不是又会迈向了一个新的阶层,一起拭目以待吧!wAk28资讯网——每日最新资讯28at.com

更多最新资讯和业内领先方案分析关注九日论道哟。也欢迎大家加入我们的知识星球,星球也正在做第二年的续费哈。wAk28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-40-498-0.htmlAI绘画的下一站:“AI拍电影” 问世

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 中美科技巨头死磕元宇宙

下一篇: 中青宝推出元宇宙婚礼,这么好的题材又玩砸了

标签:
  • 热门焦点
  • 元宇宙社交啫喱、希壤爆款迭出,腾讯慌了吗?

    文 | 陈桥辉没想到腾讯超级QQ秀的20周年归来首秀,被一款名不见经传的产品抢了风头。1月15日,一款名为“啫喱”的社交App迅速在各个互联网的社交圈内火爆起来,引起
  • 城市数字孪生标准化白皮书(2022版)

    当前,城市数字孪生已经发展成为支撑智慧城市的重要技术手段。城市数字孪生通过在数字空间对城市物理空间和社会空间进行全要素表达、全过程呈现、全周期可溯,实
  • Layer1的新以太坊,更好的以太坊?

    以太坊作为区块链基础设施地位看起来已不可动摇,但也面临着费用高、效率低、偏离去中心化初衷等问题。平台上既得利益群体的形成和固化也逐渐让革新变得困难。
  • Web3 去中心化身份管理系统的历史、现状与展望

    身份、数字资产和在线资料的映射最近在区块链行业获得了极大的关注。新技术正在形成架构,这将进一步为去中心化和以用户为中心的机制铺平道路。本文将讨论以下
  • 元宇宙是数字共识生态的集成逻辑表达

    作者: 李鸣元宇宙是数字共识生态的集成逻辑表达,是以区块链技术为核心的可信数字化价值交互网络,是基于Web3.0技术体系和运作机制支撑下的数字新生态。本体论是
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
  • Shiba Inu布局元宇宙 走出Meme局限

    以「狗狗币杀手」成名的Shiba Inu(SHIB)在人们的印象中始终有着浓厚的Meme(模因恶搞)烙印,但它似乎一直在尝试突破这种局限。建立起一个庞大的粉丝社区后,Shiba Inu
  • 元宇宙专题二:GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+DEFI(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top