当前位置:首页 > 元宇宙 > AI

AI 技术获全球顶级学术会议认可,小米 2 篇论文入选 ICCV 2025

来源: 责编: 时间:2025-07-10 16:35:13 120观看
导读 7 月 8 日消息,据小米技术消息,计算机视觉国际大会 ICCV 2025 论文录用结果公布,小米两篇论文凭借创新性研究成果成功入选:视频理解大模型核心技术 Q-Frame,推出行业首个动态帧选择与分辨率自适应框架,实现即插即用

7 月 8 日消息,据小米技术消息,计算机视觉国际大会 ICCV 2025 论文录用结果公布,小米两篇论文凭借创新性研究成果成功入选:视频理解大模型核心技术 Q-Frame,推出行业首个动态帧选择与分辨率自适应框架,实现即插即用;持续学习框架 Analytic Subspace Routing (Any-SSR),成功解决大语言模型在持续学习领域的核心难题「灾难性遗忘」问题。rWN28资讯网——每日最新资讯28at.com

rWN28资讯网——每日最新资讯28at.com

据介绍,计算机视觉国际大会 ICCV 与国际计算机视觉与模式识别会议 CVPR、欧洲计算机视觉国际会议 ECCV 并称为计算机领域世界三大顶级学术会议,每两年举办一次。其中,ICCV 2025 年投稿量达 11239 篇,录用率为 24%。上述两篇论文代表了小米 AI 团队在基座大模型领域的最新探索成果,其中视频理解大模型核心技术 Q-Frame 由小米 AI 团队全面自研,大模型持续学习框架 Any-SSR 由小米 AI 团队联合华南理工大学攻关。rWN28资讯网——每日最新资讯28at.com

全自研视频理解大模型核心技术 Q-Frame

在视频理解大模型(Video-LLMs)的研究中,小米 AI 团队针对传统“均匀帧采样”处理方式存在时间碎片化信息丢失、盲目采样及算力浪费等问题痛点,推出全自研的 Q-Frame 核心技术,该成果以论文《Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs》入选 ICCV 2025。rWN28资讯网——每日最新资讯28at.com

Q-Frame 作为视频理解大模型核心技术,是行业首个动态帧选择与分辨率自适应框架,也是首个无需训练,市面上各类视频理解大模型基座均可即插即用的算法框架。Q-Frame 拥有三大行业首次创新,能够精准理解视频内容与用户问题,通过精准捕捉跟用户问题最相关的视频关键内容,将有效信息量提升 5 倍:rWN28资讯网——每日最新资讯28at.com

跨模态查询检索(Cross-modal Query Retrieval, CQR)rWN28资讯网——每日最新资讯28at.com

查询感知帧选择(Query-aware Frame Selection, QFS)rWN28资讯网——每日最新资讯28at.com

多分辨率自适应(Multi-Resolution Adaptation, MRA)rWN28资讯网——每日最新资讯28at.com

在 MLVU 评测集上,Q-Frame 使 Qwen2-VL 的理解准确率从 55.5% 提升至 65.4%;在 LongVideoBench 上,让 GPT-4o 的准确率从 53.3% 提升到 58.6% 。此外,其多分辨率自适应特性可根据内容重要性和查询需求动态调整帧分辨率,避免算力浪费。rWN28资讯网——每日最新资讯28at.com

通过采用动态查询感知帧选择和多分辨率自适应,Q-Frame 还有效解决了「均匀帧采样」策略下时间碎片化的信息丢失、问题无感知的盲目采样和分辨率一刀切的算力浪费三大难题。与传统均匀选帧、统一处理方式不同,在有限计算资源下,Q-Frame 可使模型更高效准确理解视频。rWN28资讯网——每日最新资讯28at.com

此外,Q-Frame 具有即插即用(plug-and-play)的特点,可与市场上现有的各类视频理解大模型兼容,无论是开源模型还是闭源模型,无需对模型进行额外的训练或微调。以 VILA-V1.5 和 Qwen2-VL 等开源模型为例,在集成 Q-Frame 后,这些模型在视频理解任务上的性能均得到了显著提升。同样,对于闭源的 GPT-4o 模型,Q-Frame 也展现出了良好的兼容性,进一步证明了其广泛的适用性。rWN28资讯网——每日最新资讯28at.com

Q-Frame 在小米「人车家全生态」战略中有着多元的应用场景,目前正在持续探索和落地:小米 YU7 发布时提到的哨兵模式中,能够分清楚普通的风吹草动和可能带来剐蹭、碰撞的危险行为;智能家居中,能够在监控画面中找到最关键的画面,帮助用户解答问题;在小爱视频问答场景中,可以直接定位到视频中能够解答问题的片段开始播放等。rWN28资讯网——每日最新资讯28at.com

大模型持续学习框架 Any-SSR

在大语言模型(LLMs)持续学习(Continual Learning, CL)领域,往往会因新任务的学习而导致对旧任务知识的遗忘,即灾难性遗忘问题。小米 AI 团队联合华南理工大学针对这一难题开展研究,其成果《Analytic Subspace Routing: How Recursive Least Squares Works in Continual Learning of Large Language Model》成功入选 ICCV 2025。rWN28资讯网——每日最新资讯28at.com

Any-SSR 框架作为行业首个将递归最小二乘法(Recursive Least Squares, RLS)引入大语言模型持续学习的技术框架,通过分析路由机制,动态地把不同任务分配到独立子空间学习,避免任务间知识干扰,创新性解决了大语言模型持续学习中灾难性遗忘问题。同时,利用低秩适应(Low-Rank Adaptation, LoRA)与分析路由相结合的方式,实现了新旧知识的无缝整合与动态学习。rWN28资讯网——每日最新资讯28at.com

在一系列技术创新的基础上,Any-SSR 方法实现了“近乎完美”的知识保留(即不遗忘),同时能无缝地学习新知识。在实验中,Any-SSR 在 TRACE 基准测试上的表现显著优于其他方法,包括多任务学习(MTL)等,不仅在整体性能(OP)上取得了优异成绩,还实现了零反向知识转移(BWT)。rWN28资讯网——每日最新资讯28at.com

从小米技术获悉,过去五年,小米集团研发投入约 1020 亿元,在 2025 年的 300 亿研发投入中,大约有四分之一将被用于 AI 相关方向。未来五年(2026-2030 年),小米还将在核心技术赛道再投入 2000 亿元。rWN28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-14471-0.htmlAI 技术获全球顶级学术会议认可,小米 2 篇论文入选 ICCV 2025

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 日本 2024 财年生成式 AI 使用率仅 26.7%,远落后于中美

下一篇: 云深处科技完成近 5 亿元新融资,加速具身智能产业化布局

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 元娲2.7上线:虚拟人视频制作速度疯狂翻倍!

    来源:清元宇宙 炎炎夏日努力工作的Q仔的电脑都冒烟儿啦~今天要给大家介绍两个新小伙伴——小元和小娲,他们将给大家解读元娲2.7版本重磅更新内容~大家掌声欢迎~~~本次更
  • 风口已至,多领域平台融入社交元素!

    在众多领域平台中,社交元素都扮演着重要角色,如直播营销带货、线上配对听歌、游戏局内互动等。随着元宇宙时代的来临,社交产品不断升级,社交元素推动流量变现,多平台领域融入社交
  • 2022开年最热投资赛道竟是虚拟人,背后隐藏了什么商业价值?

    在刚刚结束不久的2021年江苏卫视跨年演唱会上,虚拟邓丽君与歌手周深同台联唱,实现了跨时代合作,而这还不只是“邓丽君”,哔哩哔哩、东方卫视等多家跨年晚会都出现
  • 元宇宙时代NFT的价值衡量

    有人认为NFT的高昂价格只是炒作的产物,并不具有其对等的价值,但其实NFT并不是空中楼阁,只是区块链数字分类账中的一种形式。诚然,目前的NFT仍处于灰色地带,相关的法
  • 高通成立欧洲XR实验室;ICICB计划进军元宇宙......

    扩展现实(XR)通过计算机将真实与虚拟相结合,打造了一个可人机交互的虚拟环境,将AR、VR、MR多种技术相融合,为体验者带来了虚拟世界与现实世界之间无缝转换的“沉浸
  • 以太坊伦敦升级后,随之生效的以太坊EIP-1559是什么?

    作者:三黎过去的一年里,除了 BTC 一如既往稳坐王位,DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时,也使得其网络日渐拥堵、交易费用增高,成为
  • NFT 技术将传世之作带入博物馆

    意大利四大博物馆已与一个项目合作,该项目将展示和销售达芬奇、卡拉瓦乔、拉斐尔和莫迪利亚尼等人的杰作的 NFT复制品。该计划采用了 科技公司Cincello的国际专
  • 超级账本Julian Gordon:联盟链与公链的竞争不是非此即彼

    在2021年《福布斯》区块链50强榜单中,29家企业使用Hyperledger超级账本技术,占比近60%。同年,研究机构Blockdata发布了的调查报告显示,访问Top100上市公司中,有 81
Top