当前位置:首页 > 元宇宙 > AI

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

来源: 责编: 时间:2023-11-20 17:10:26 431观看
导读 11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的

11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。IRU28资讯网——每日最新资讯28at.com

谷歌和谷歌 Deepmind 的研究人员提出了新的方法,将多模态理解扩展到长视频领域。IRU28资讯网——每日最新资讯28at.com

借助 Mirasol AI 模型,该团队试图解决两个关键挑战:IRU28资讯网——每日最新资讯28at.com

需要以高频采样同步视频和音频,但要异步处理标题和视频描述。IRU28资讯网——每日最新资讯28at.com

视频和音频会生成大量数据,这会让模型的容量紧张。IRU28资讯网——每日最新资讯28at.com

谷歌在 Mirasol 中使用合路器(combiners)和自回归转换器(autoregressive transformer)模型。IRU28资讯网——每日最新资讯28at.com

该模型组件会处理时间同步的视频和音频信号,然后再将视频拆分为单独的片段。IRU28资讯网——每日最新资讯28at.com

转换器处理每个片段,并学习每个片段之间的联系,然后使用另一个转换器处理上下文文本,这两个组件交换有关其各自输入的信息。IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

名为 Combiner 的新颖转换模块从每个片段中提取通用表示,并通过降维来压缩数据。每个段包含 4 到 64 帧,该模型当前共有 30 亿个参数,可以处理 128 到 512 帧的视频。IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

在测试中,Mirasol3B 在视频问题分析方面达到了新的基准,体积明显更小,并且可以处理更长的视频。使用包含内存的组合器变体,该团队可以将所需的计算能力进一步降低 18%。IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

IRU28资讯网——每日最新资讯28at.com

在此附上 Mirasol 的官方新闻稿,感兴趣的用户可以深入阅读。IRU28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-2592-0.html谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 浙江卫健委推出可陪诊数字健康人“安诊儿”:基于支付宝技术,可提供全流程陪伴

下一篇: TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现

标签:
  • 热门焦点
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • “平均时代”:ChatGPT模仿秀的隐喻

    来源:锦缎如果你问ChatGPT,Instagram上最美的女人是谁?它很可能会给你一个名字,叫卡戴珊。如果你观察过Instagram这个美版小红书:平台上的所有网红,展现的几乎是统一面孔:统一的医
  • 2022开年最热投资赛道竟是虚拟人,背后隐藏了什么商业价值?

    在刚刚结束不久的2021年江苏卫视跨年演唱会上,虚拟邓丽君与歌手周深同台联唱,实现了跨时代合作,而这还不只是“邓丽君”,哔哩哔哩、东方卫视等多家跨年晚会都出现
  • “元宇宙”里过大年,《迷你世界》在做一场怎样的实验?

    2021年是游戏行业不确定性急剧上升的一年。一方面游戏正风光无限,腾讯等大厂更加密集地投资动作,让游戏创投市场异常火热,"元宇宙"概念的大放异彩,更是吸引了Netfl
  • 新款英特尔芯片将使NFT铸造变得更加方便

    科技巨头和微处理器制造商英特尔(Intel)正在发布一款适用于 NFT 铸造和挖矿的新芯片。新产品专注于效率、易操作性和可持续性,该公司的战略是从加密兴起与 NFT爆
  • 元宇宙是推动NFT发展的初始家园

    现在大家都知道了什么是NFT,但好像离自己的生活还有一定距离。随着我们与NFT 接触增加,该如何将这些数字资产带入我们的日常生活?NFT还是主流吗?如果我们将“主流
  • 2022年去中心化交易所会崛起吗?

    “在某个时候,去中心化衍生品的交易量可能会超过去中心化现货交易所。”DEX 越来越多地转向第二层解决方案。“数字化金融市场的概念以及如何沿着以用户为中心
  • 王老吉启动元宇宙“吉空间”,HTC发布元宇宙应用VIVERSE

    今日《元宇宙新鲜事》有:王老吉启动元宇宙“吉空间”;HTC发布元宇宙应用VIVERSE;Meta将在马德里构建一个元宇宙创新中心;央视网《新闻+》推出系列视频《聊聊元宇宙
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top