当前位置:首页 > 元宇宙 > AI

谷歌 Veo 2 升级可生成更具电影感视频,文本、音频 AI 同步升级

来源: 责编: 时间:2025-04-13 08:41:48 146观看
导读 4 月 10 日消息,谷歌为其视频 AI 模型 Veo 2 推出新功能,旨在帮助用户更轻松地生成具有电影质感的画面以及编辑真实视频。这些新增的 Veo 2 功能目前可通过谷歌云的 Vertex AI 平台进行预览,与此同时,谷歌还对文

4 月 10 日消息,谷歌为其视频 AI 模型 Veo 2 推出新功能,旨在帮助用户更轻松地生成具有电影质感的画面以及编辑真实视频。这些新增的 Veo 2 功能目前可通过谷歌云的 Vertex AI 平台进行预览,与此同时,谷歌还对文本转图像生成器 Imagen 3 以及音频相关 AI 模型进行了更新。SP128资讯网——每日最新资讯28at.com

SP128资讯网——每日最新资讯28at.com

据了解,Veo 2 的新功能包括修复功能(inpainting)和外扩功能(outpainting)。谷歌表示,修复功能可以自动移除视频中的“不想要的背景图像、标志或干扰元素”,而外扩功能则能够将原始视频的画面进行扩展,该工具会用 AI 生成的视频片段填充新增的空间,使其与原始片段自然融合,类似于 Adobe 为图像提供的生成式扩展功能。SP128资讯网——每日最新资讯28at.com

SP128资讯网——每日最新资讯28at.com

此次更新还允许 Veo 2 用户在生成画面时,将电影拍摄技巧预设与文字描述一同选用,以便指导最终结果中的镜头构图、拍摄角度和节奏。例如,预设包括延时效果、无人机视角以及模拟不同方向的镜头平移等。SP128资讯网——每日最新资讯28at.com

此外,Veo 2 新增了一种插值功能,能够为两个静态图像之间创建视频过渡,为开头和结尾序列填充新的帧。SP128资讯网——每日最新资讯28at.com

SP128资讯网——每日最新资讯28at.com

Adobe 的竞争产品 Firefly 视频模型也具备一些类似的功能,其生成式 AI 视频扩展功能于上周在 Premiere Pro 中推出。谷歌还在其 AI 生成的输出中加入了 SynthID 数字归属水印,类似于 Adobe 的内容凭证系统。不过,Adobe 进一步承诺其工具完全可用于商业用途,因为它们是基于授权和公有领域内容进行训练的,而谷歌在训练其 AI 模型时大量抓取了网络上的内容,无法达到这一标准。SP128资讯网——每日最新资讯28at.com

在文本转图像模型 Imagen 3 方面,谷歌对其编辑功能进行了更新,声称可以“显著”提升自动移除物体的效果,使移除干扰元素后的结果看起来更加自然。Veo 2 和 Imagen 3 已被包括欧莱雅和卡夫亨氏在内的公司用于营销内容制作。卡夫亨氏的数字体验负责人贾斯汀・托马斯表示,过去需要八周才能完成的任务,现在只需八小时。SP128资讯网——每日最新资讯28at.com

SP128资讯网——每日最新资讯28at.com

在音频领域,谷歌推出了其文本转音乐模型 Lyria 的私人预览版,并为其合成语音模型 Chirp 3 推出了“即时定制语音”功能。谷歌称,Chirp 3 现在能够从 10 秒的音频输入中生成“逼真的定制语音”,并且正在推出一项新的转录功能预览,该功能可以识别并分离出多人对话中的各个说话者,从而为多参与者的谈话提供更清晰的转录。SP128资讯网——每日最新资讯28at.com

这些更新只是谷歌今日宣布的一系列 AI 相关消息中的一部分。谷歌效率优化型 Flash 模型的最新版本 Gemini 2.5 Flash 即将登陆 Vertex AI。谷歌表示,Gemini 2.5 Flash 会根据任务的复杂程度“自动调整处理时间”,以便为简单请求提供更快的结果。SP128资讯网——每日最新资讯28at.com

此外,谷歌本周还将更新其面向企业的 Agentic AI 工具,使 AI 代理能够在不同平台(如 PayPal 和 Salesforce)之间相互沟通并执行任务。同时,谷歌云市场将推出一个新板块,供企业浏览和购买由第三方谷歌合作伙伴构建的 AI 代理。SP128资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12214-0.html谷歌 Veo 2 升级可生成更具电影感视频,文本、音频 AI 同步升级

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

下一篇: 谷歌推出 Vertex AI Media Studio 文生视频套件:自动化包办画面渲染、旁白、配乐等

标签:
  • 热门焦点
  • 一份全面清单:Web3行业高薪酬的13种工作

    来源:区块链骑士这可能会让许多人感到震惊,但除了成为开发人员之外,Web3还有其他高薪工作。Web3可能是现代就业市场中跨学科最多的领域,换句话说,它由许多个在不同领域中具有不同
  • 花房集团上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集团在港交所成功上市,首日便受到追捧,当日最高涨幅达28.75%。继360、360数科、鲁大师后,这是“红衣教主”周
  • 汽车元宇宙,是概念还是未来?

    作者|何文 元宇宙是未来趋势已经无需验证。 从概念上来看,元宇宙是两种存在多年的概念的融合:虚拟现实和数字第二人生。这也就意味着,元宇宙所代表的是一种新的数
  • 元宇宙风口下,视觉中国如何重估?

    要说横跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一个。不仅互联网巨头们纷纷布局,上市公司们趋之若鹜,还被不少地方政府写入了产业规划,大有在2022年
  • 完美世界被元宇宙“拒之门外”

    春节期间,游戏是消磨时间最好的方式,完美世界的《幻塔》作为选择的首要目标,倒不是因为它的吸引力有多大,纯粹是广大网友的吐槽。继《原神》之后,进击元宇宙的游戏
  • 餐桌上怎么变出元宇宙?

    作者:星影“元宇宙让餐饮业脱胎换骨。”实体的餐饮与虚拟的元宇宙,看起来风马牛不相及,但最近全世界的餐饮企业都掀起了一股注册元宇宙商标的热潮。2月初,全球最大
  • 赵长鹏预测SoicalFi为今年主要驱动力,新的机会在哪里?

    作者:五火球教主前不久,赵长鹏在《财富》杂志印度版块刊登评论。他表示:“DeFi 在 2021 年出现了快速创新,我们可能会在 2022 年看到蓬勃发展的兴趣和创新,其中 Soc
  • Staking 收益翻倍?

    以太坊质押可能很快就会有两倍的利润。Coinbase 估计,在 1 月份以太坊网络合并后,持有 ETH 的回报将翻倍。增长预期假设来自加密货币交易所 Coinbase 的估计是准
  • 虚拟人行业研究报告

    最早的虚拟人出现于 20 世纪 80 年代,受限于技术,当时的虚拟人制作以手绘为主。21 世纪初,随着动捕、渲染等技术的逐步发展,虚拟人相关技术开始在影视领域逐渐普及
Top