当前位置:首页 > 科技  > 网络

限时免费!通义千问多模态大模型重磅升级:性能赶超GPT-4V和谷歌Gemini

来源: 责编: 时间:2024-01-26 17:04:51 350观看
导读 快科技1月26日消息,今日,阿里云公布多模态大模型研究进展。据悉,通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题

快科技1月26日消息,今日,阿里云公布多模态大模型研究进展。ZgN28资讯网——每日最新资讯28at.com

据悉,通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,整体性能堪比GPT-4V和Gemini Ultra。ZgN28资讯网——每日最新资讯28at.com

限时免费!通义千问多模态大模型重磅升级:性能赶超GPT-4V和谷歌GeminiZgN28资讯网——每日最新资讯28at.com

Qwen-VL-Plus和Qwen-VL-Max在MMMU、MathVista等测评中远超业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越GPT-4V,达到世界佳水平。ZgN28资讯网——每日最新资讯28at.com

基础能力方面,升级版模型能够准确描述和识别图片信息,并且根据图片进行信息推理、扩展创作;具备视觉定位能力,还可针对画面指定区域进行问答。ZgN28资讯网——每日最新资讯28at.com

视觉推理方面,Qwen-VL-Plus和Qwen-VL-Max可以理解流程图等复杂形式图片,可以分析复杂图标,看图做题、看图作文、看图写代码也不在话下。ZgN28资讯网——每日最新资讯28at.com

限时免费!通义千问多模态大模型重磅升级:性能赶超GPT-4V和谷歌GeminiQwen-VL-Max看图做题ZgN28资讯网——每日最新资讯28at.com

图像文本处理方面,升级版Qwen-VL的中英文文本识别能力显著提高,支持百万像素以上的高清分辨率图和极端宽高比的图像,既能完整复现密集文本,也能从表格和文档中提取信息。ZgN28资讯网——每日最新资讯28at.com

限时免费!通义千问多模态大模型重磅升级:性能赶超GPT-4V和谷歌GeminiQwen-VL-Max复现密集文本ZgN28资讯网——每日最新资讯28at.com

LLM(大语言模型)之后,大模型领域的下一个爆点是什么?多模态是当前具共识的方向。过去半年来,OpenAI、谷歌等争相推出多模态模型,阿里云也在2023年8月发布并开源具备图文理解能力的Qwen-VL模型,Qwen-VL取得了同期远超同等规模通用模型的表现。ZgN28资讯网——每日最新资讯28at.com

视觉是多模态能力中重要的模态,作为人类感知世界、认知世界的第一感官,视觉传递的信息占据了“五感”信息的80%。通义千问视觉语言模型基于通义千问LLM开发,通过将视觉表示学习模型与LLM对齐,赋予AI理解视觉信息的能力,在大语言模型的“心灵”上开了一扇视觉的“窗”。ZgN28资讯网——每日最新资讯28at.com

相比LLM,多模态大模型拥有更大的应用想象力。比如,有研究者在探索将多模态大模型与自动驾驶场景结合,为“完全自动驾驶”找到新的技术路径;将多模态模型部署到手机、机器人、智能音箱等端侧设备,让智能设备自动理解物理世界的信息;或者基于多模态模型开发应用,辅助视力障碍群体的日常生活等等。ZgN28资讯网——每日最新资讯28at.com

目前,Qwen-VL-Plus和Qwen-VL-Max限时免费,用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型API。ZgN28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-68940-0.html限时免费!通义千问多模态大模型重磅升级:性能赶超GPT-4V和谷歌Gemini

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微软的2.5倍:苹果公司人均创收达1680万元!

下一篇: 销量领跑!vivo夺得2023年中国手机市场国产品牌第一

标签:
  • 热门焦点
  • 一加Ace2 Pro官宣:普及16G内存 引领24G

    一加官方今天继续为本月发布的新机一加Ace2 Pro带来预热,公布了内存方面的信息。“淘汰 8GB ,12GB 起步,16GB 普及,24GB 引领,还有呢?#一加Ace2Pro#,2023 年 8 月,敬请期待。”同时
  • 红魔电竞平板评测:大屏幕硬实力

    前言:三年的疫情因为要上网课的原因激活了平板市场,如今网课的时代已经过去,大家的生活都恢复到了正轨,这也就意味着,真正考验平板电脑生存的环境来了。也就是面对着这种残酷的
  • 6月安卓手机性价比榜:Note 12 Turbo断层式碾压

    6月份有一个618,虽然这是京东周年庆的日子,但别的电商也都不约而同的跟进了,反正促销没坏处,厂商和用户都能满意。618期间一些产品也出现了历史低价,那么各个价位段的产品性价比
  • 5月安卓手机好评榜:魅族20 Pro夺冠

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年5月1日至5月31日,仅限国内市场。第一名:魅族20 Pro好评率:97.50%不得不感慨魅族老品牌还
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • iQOO 11S屏幕细节公布:首发三星2K E6全感屏 安卓最好的直屏手机

    日前iQOO手机官方宣布,新一代电竞旗舰iQOO 11S将会在7月4日19:00正式与大家见面。随着发布时间的日益临近,官方关于该机的预热也更加密集,截至目前已
  • iQOO Neo8系列新品发布会

    旗舰双芯 更强更Pro
  • 苹果MacBook Pro 2021测试:仍不支持平滑滚动

    据10月30日9to5 Mac 消息报道,苹果新的 14 英寸和 16 英寸 MacBook Pro 2021 上市后获得了不错的评价,亮点包括行业领先的性能,令人印象深刻的电池续航,精美丰
Top