当前位置:首页 > 科技  > 芯片

英伟达联合推出超强多模态模型DAM

来源:icspec 责编: 时间:2025-04-28 07:35:34 158观看
导读据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。DAM模型专注于详细局部标注(D
据报道,英伟达与加州大学伯克利分校、加州大学旧金山分校团队合作,推出了一款名为Describe Anything Model(DAM)的多模态模型。这款模型仅包含30亿参数,却能够精准描述图像和视频中的任何细节。
DAM模型专注于详细局部标注(DLC),即为特定区域生成详细且精确的描述。通过两大创新,研究人员在细节与上下文之间找到了平衡。其一是焦点提示,对目标区域进行高分辨率编码,就像给模型配备了一副“放大镜”,清晰捕捉到局部区域的细微特征。其二是局部视觉骨干网络,将精确定位的特定区域与上下文无缝整合。
在项目主页中,研究团队展示了更多精彩demo。用户通过点、框、涂鸦或掩码的交互,即可一键生成描述。例如,上传一张柯基在草地上奔跑的图片,选中柯基,DAM会生成一段详细的描述:“一只中等体型的狗,拥有浓密的红棕色毛发,腹部和腿部为白色。这只狗尾巴蓬松,耳朵尖立,戴着带有银色吊牌的红色项圈。它张着嘴露出牙齿,舌头伸在外面。狗呈奔跑姿势,前腿向前伸展,后腿向后伸直。”
DAM的技术架构确保了其在生成关键词、短语,甚至是多句式的复杂描述时,都能保持高精度和连贯性。此外,研究团队设计了基于半监督学习的流水线(DLC-SDP),通过两阶段策略构建大规模训练数据。
为了公平评估DLC模型,研究团队提出了全新基准DLC-Bench。通过LLM判断,检查描述的正确细节和错误缺失,而非简单对比文本。在DLC-Bench和其他7个涵盖图像与视频的基准测试中,DAM全面超越现有模型,树立了新的标杆。
DAM的优势主要有三大点:更详细、更准确;更少幻觉;多场景适用。其强大能力为众多应用场景打开了大门,未来诸如数据标注、医疗影像、内容创作等领域,都可以加速落地。
Long (Tony) Lian是UC伯克利电子工程与计算机科学博士研究生,他的研究主要聚焦于通过强化学习开发具备推理能力的大模型与视觉语言模型。此前,他曾在英伟达研究院Deep Imagination Research团队实习。Long (Tony) Lian本科毕业于UC伯克利计算机科学专业。

本文链接:http://www.28at.com/showinfo-27-147931-0.html英伟达联合推出超强多模态模型DAM

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 本田电动化新作:烨GT与P7双车齐发

下一篇: 和辉光电递表港交所,AMOLED面板业务表现亮眼

标签:
  • 热门焦点
  • 天猫精灵Sound Pro体验:智能音箱没有音质?来听听我的

    这几年除了手机作为智能生活终端最主要的核心之外,第二个可以成为中心点的产品是什么?——是智能音箱。 手机在执行命令的时候有两种操作方式,手和智能语音助手,而智能音箱只
  • 掘力计划第 20 期:Flutter 混合开发的混乱之治

    在掘力计划系列活动第20场,《Flutter 开发实战详解》作者,掘金优秀作者,Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
  • 学习JavaScript的10个理由...

    作者 | Simplilearn编译 | 王瑞平当你决心学习一门语言的时候,很难选择到底应该学习哪一门,常用的语言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 破圈是B站头上的紧箍咒

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之每年的暑期档都少不了瞄准追剧女孩们的古偶剧集,2021年有优酷的《山河令》,2022年有爱奇艺的《苍兰诀》,今年却轮到小破站抓住了追
  • 网传小米汽车开始筛选交付中心 建筑面积不低于3000平方米

    7月7日消息,近日有微博网友@长三角行健者爆料称,据经销商集团反馈,小米汽车目前已经开始了交付中心的筛选工作,要求候选场地至少有120个车位,建筑不能低
  • 首发天玑9200+ iQOO Neo8系列发布首销售价2299元起

    2023年5月23日晚,iQOO Neo8系列正式发布。其中,Neo系列首款Pro之作——iQOO Neo8 Pro强悍登场,限时售价3099元起;价位段最强性能手机iQOO Neo8同期上市
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
  • 北京:科技教育体验基地开始登记

      北京“科技馆之城”科技教育体验基地登记和认证工作日前启动。首批北京科技教育体验基地拟于2023年全国科普日期间挂牌,后续还将开展常态化登记。  北京科技教育体验基
Top