当前位置:首页 > 元宇宙 > AI

微软推出42亿参数新AI模型Phi-3-vision,主打视觉理解

来源: 责编: 时间:2024-05-27 08:53:55 216观看
导读5月26日消息,微软最近推出了其小语言AI模型家族(SLM)的全新成员——“Phi-3-vision”。此款模型以“视觉能力”为主打特色,不仅能理解图文内容,还被誉为能在移动平台上实现流畅高效的运行。Phi-3-vision模型,作为微软Phi-

5月26日消息,微软最近推出了其小语言AI模型家族(SLM)的全新成员——“Phi-3-vision”。此款模型以“视觉能力”为主打特色,不仅能理解图文内容,还被誉为能在移动平台上实现流畅高效的运行。0n928资讯网——每日最新资讯28at.com

Phi-3-vision模型,作为微软Phi-3系列的首款多模态模型,其文字理解能力源于Phi-3-mini,并继承了其轻量化特性,非常适合在移动设备或嵌入式系统中运行。该模型拥有42亿的参数量,这一数字超过了Phi-3-mini的3.8亿,但低于Phi-3-small的70亿。其上下文长度达到了128ktoken,训练周期从2024年2月持续至4月。0n928资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,Phi-3-vision模型的最大亮点在于其“图文识别能力”。它不仅能够理解现实世界中图片的含义,还能迅速识别和提取图片中的文字信息。微软表示,这款模型在办公场合中表现出色,特别是在识别和理解图表及方块图方面有着出色的能力。它可以根据用户输入的信息进行推理,并为企业提供有价值的战略建议,其效果甚至可与大型模型相媲美。0n928资讯网——每日最新资讯28at.com

在模型训练方面,微软强调Phi-3-vision是通过多种类型的图片和文字数据进行训练的,这些数据来源于一系列经过严格筛选的公开内容,如教育材料、代码、图文标注数据等,从而确保了模型能够处理多样化的输入。同时,微软也注重用户隐私的保护,在训练数据中严格排除了任何个人信息。0n928资讯网——每日最新资讯28at.com

0n928资讯网——每日最新资讯28at.com

性能方面,微软提供了Phi-3-vision与其他竞品模型如字节跳动的Llama3-Llava-Next(8B)、微软研究院与其他机构合作的LlaVA-1.6(7B)以及阿里巴巴的通义千问QWEN-VL-Chat等模型的对比图表。结果显示,Phi-3-vision在多个测试项目中均表现出色。0n928资讯网——每日最新资讯28at.com

目前,微软已经将Phi-3-vision模型上传至Hugging Face平台。0n928资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-5568-0.html微软推出42亿参数新AI模型Phi-3-vision,主打视觉理解

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 马斯克再出大手笔,xAI将建由数万个芯片组成的算力超级工厂

下一篇: 中国电信发布支持30种方言的语音识别大模型‘星辰

标签:
  • 热门焦点
  • 文心一言排名垫底,却成为百度业绩增长杠杆

    文/侯煜编辑/罗卿知识增强大预言模式文心一言发布后,百度公司热度大幅提升,文心一言到底能为百度的业绩带来多大的增益成为业内关注焦点。近日,百度(NASDAQ:BIDU/09888.HK)公布了
  • 从科幻走进现实,元宇宙概念逐渐清晰

    2021年,元宇宙概念如同一颗炸弹投进互联网行业,掀起了一场数字海啸,众多企业纷纷入局,在此新领域展开新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻红,元宇宙走进资本圈2021年3
  • “元宇宙第一股”Roblox首份年报未达预期,摩根大通成为首家进入元宇宙的银行

    今日《元宇宙新鲜事》有:“元宇宙第一股”Roblox首份年报未达预期致盘后股价暴跌15.28%;YouTube宣布进军区块链和元宇宙;摩根大通成为首家进入元宇宙的银行。【中
  • 银保监会:打击以“元宇宙”为名义的违法行为

    今日,银保监会发布《关于防范以“元宇宙”名义进行非法集资的风险提示》,全文如下:近期,一些不法分子蹭热点,以“元宇宙投资项目”“元宇宙链游”等名目吸收资金,涉
  • 餐桌上怎么变出元宇宙?

    作者:星影“元宇宙让餐饮业脱胎换骨。”实体的餐饮与虚拟的元宇宙,看起来风马牛不相及,但最近全世界的餐饮企业都掀起了一股注册元宇宙商标的热潮。2月初,全球最大
  • 在元宇宙开会是什么样一种体验

    空间就是一切还记得面对面的会议吗?就在不久前,与会者需要飞到遥远的目的地,并进行鼓舞人心的对话、网络、免费食物,甚至可能会有一两个很好的小组讨论。随之而来
  • GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+Defi(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
  • HTC Vive推出元宇宙平台Viverse;腾讯投资小米生态链AR眼镜厂商

    今日热点:HTC Vive正式推出元宇宙平台Viverse;腾讯投资小米生态链AR眼镜厂商北京蜂巢科技;面部追踪和眼动追踪是Quest下一版本的“重点”;索尼PSVR 2将推迟至2023
  • 虚拟人行业研究报告

    最早的虚拟人出现于 20 世纪 80 年代,受限于技术,当时的虚拟人制作以手绘为主。21 世纪初,随着动捕、渲染等技术的逐步发展,虚拟人相关技术开始在影视领域逐渐普及
Top