当前位置:首页 > 科技  > 数码

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速

来源: 责编: 时间:2024-04-10 08:34:02 306观看
导读 快科技4月9日消息,AMD今天宣布,旗下的Versal自适应片上系统(SoC)产品升级全新第二代,包括面向AI驱动型嵌入式系统第二代的Versal AI Edge系列、面向经典嵌入式系统的第二代Versal Prime系列。新一代产品很好地

快科技4月9日消息,AMD今天宣布,旗下的Versal自适应片上系统(SoC)产品升级全新第二代,包括面向AI驱动型嵌入式系统第二代的Versal AI Edge系列、面向经典嵌入式系统的第二代Versal Prime系列。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

新一代产品很好地平衡了性能、功耗、面积,以及先进的功能安全与信息安全,可广泛应用于汽车、工业、视觉、医疗、广播、专业音视频等市场领域。jqw28资讯网——每日最新资讯28at.com

新品在单器件内集成了预处理、AI推理、后处理,可为AI嵌入式系统提供端到端的全程加速。jqw28资讯网——每日最新资讯28at.com

这也是AMD董事会主席及CEO苏姿丰此前提出的“AI无处不在”战略的新体现。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

对于AI驱动的嵌入式系统,核心当然是AI推理,也就是AI算法执行的阶段,但是预处理、后处理两个阶段同样不容忽视。jqw28资讯网——每日最新资讯28at.com

一般而言,预处理阶段主要是摄像头、雷达、激光雷达等传感器的处理、融合,以及数据的交集和调节。jqw28资讯网——每日最新资讯28at.com

这一阶段需要嵌入式系统与环境进行实时交互与处理,决定着整个系统的性能,因此需要可编程逻辑来实现灵活的实时处理,包括连接任意传感器和接口,保证低时延、确定性,以及现场部署后依然可升级,一般还要加上FPGA、SoC进行优化。jqw28资讯网——每日最新资讯28at.com

AI推理阶段需要实时嵌入式系统解决感知、分析、情境感知问题,一般使用矢量处理器,也就是非自适应性SoC。jqw28资讯网——每日最新资讯28at.com

后处理阶段需要实现决策、控制、反馈,一般使用高性能嵌入式CPU。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

这三个阶段都必须能够加速,才可以真正实现全系统的实时。jqw28资讯网——每日最新资讯28at.com

但是,之前没有任何一类处理器可以同时针对三个阶段进行优化加速,都需要多芯片共同组成解决方案。jqw28资讯网——每日最新资讯28at.com

比如说用AMD第一代Versal AI Edge系列的可编程逻辑做预处理,然后用矢量处理或者AI引擎做推理,后处理阶段再配置外部处理器。jqw28资讯网——每日最新资讯28at.com

类似方案都存在功耗更高、供电更复杂、占用空间更大、外部内存需求更多、芯片间时延更长等问题,还容易存在更多安全漏洞。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

AMD的第二代 Versal 系列自适应SoC以第一代为基础升级而来。jqw28资讯网——每日最新资讯28at.com

无论是面向AI驱动型嵌入式系统的AI Edge系列,还是面向经典嵌入式系统的Prime系列,同样具备强大的全新AI引擎,每瓦TOPS算力(即能效)是第一代AI Edge系列的多3倍。jqw28资讯网——每日最新资讯28at.com

处理系统部分(PS)集成了全新的高性能Arm CPU核心,包括Cortex-A78AE应用处理器核心、Cortex-R52实时处理器核心,标量计算性能预计可比第一代提升多10倍,jqw28资讯网——每日最新资讯28at.com

全新的AMD可编程逻辑(PL),具备领先的自适应计算能力,可实现灵活的实时预处理。jqw28资讯网——每日最新资讯28at.com

此外还集成了Arm Mali-G78AE GPU图形核心、DDR5/LPDDR5X内存控制器、PCIe 5.0控制器、100G以太网控制器、DPS图像信号处理器、视频编解码器、功能与信息安全模块、处理器接口、视频处理单元等等众多单元,单颗芯片搞定一切。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

正因为如此,AMD第二代Versal才是真正的自适应SoC,才能在单个器件中提供端到端的全程加速。jqw28资讯网——每日最新资讯28at.com

单芯片设计的高级程度,还可以大大降低系统功耗、占用空间、复杂性。jqw28资讯网——每日最新资讯28at.com

功能安全性增强之后,也不再需要外部安全微控制器,或者外部存储,不需要在多个处理器之间共享。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

第二代Versal AI Edge系列器件通过采用优处理器组合,能够为AI驱动型嵌入式系统的全部三个阶段进行加速,满足现实系统的复杂处理需求。jqw28资讯网——每日最新资讯28at.com

在预处理阶段,AMD FPGA可编程逻辑架构用于实时处理,可以密集、灵活地连接各种传感器,包括各种图像传感器、摄像头、激光雷达、超声波、定位系统、IMU惯性测量单元、内窥镜探头等等,并进行高吞吐量、低时延的数据处理。jqw28资讯网——每日最新资讯28at.com

可编程逻辑的引入,能够摆脱对外部存储、CPU/GPU处理器的依赖,并针对特定任务进行定制优化,从而直接连接到推理加速卡,大大节省执行时间。jqw28资讯网——每日最新资讯28at.com

可编程I/O则支持广泛的不同传输速率、电压和工作模式,相比固定I/O更加灵活。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

推理阶段,矢量处理器阵列构成了下一代 AI引擎“AIE-ML v2”。jqw28资讯网——每日最新资讯28at.com

它内置硬化控制处理器,不再需要使用可编程逻辑进行控制,因此可以将可编程逻辑资源释放用于传感器、硬图像和视频等数据的处理。jqw28资讯网——每日最新资讯28at.com

新的AI引擎还原生支持更多数据类型,包括全新的FP8、FP16、MX6、MX9,并继续支持INT8、INT16、BF16。jqw28资讯网——每日最新资讯28at.com

Dense性能方面,INT16算力高46TOPS,FP16、BF16算力高92TOPS,INT8、FP8、FPMX9算力高184TOPS,MX6算力高369TOPS。jqw28资讯网——每日最新资讯28at.com

高稀疏度算力更高,比如INT8高可以达到368TOPS。jqw28资讯网——每日最新资讯28at.com

MX6、MX9属于共享指数数据类型,可以节省每个元素所占用的字节数,其中MX6对比INT8的能效可提升多达60%,而且精度类似甚至更高。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

为了充分释放AI引擎的算力性能,AMD同时提供了Vitis AI开发环境,提供丰富的量化器、剪枝、模型编译器与工具、运行时、驱动、固件等全套开发资源,以及培训、文档、参考设计等。jqw28资讯网——每日最新资讯28at.com

它还支持开源生态系统,采用行业标准框架,包括PyTorch、TensorFlow、ONNX、Triton等等,也支持第三方量化器和稀疏工具。jqw28资讯网——每日最新资讯28at.com

对于各种模型、运算符、数据类型,Vitis AI环境都支持开箱即用,包括卷积神经网络(CNN)、视觉Transformer等等。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

后处理阶段,Arm CPU内核可为安全关键型应用提供复杂决策与控制所需的能力。jqw28资讯网——每日最新资讯28at.com

针对复杂决策与繁重工作负载的应用处理单元(APU),基于Arm Cortex-A78AE核心,高频率2.2GHz,算力高达200.3K DMIPS,是上代的多8倍。jqw28资讯网——每日最新资讯28at.com

针对控制功能的实时处理单元(RPU),则基于Arm Cortex-R52核心,高频率1.05GHz,算力高达28.5K DMIPS,是上代的多10倍。jqw28资讯网——每日最新资讯28at.com

另外,因为未来需要通过车规级认证、安全认证,尤其是高级别型号会用于ASIL D汽车、SIL 3工业和机器人领域,必须应对随机故障,确保功能安全与信息安全,所以在锁步模式下算力性能会减半,以便留出足够的冗余空间。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

当然,理论指标和性能终要转化为实际应用,才能真正体现出来。jqw28资讯网——每日最新资讯28at.com

比如高级自动驾驶辅助系统L2+/L3,由于加入硬图像处理功能,图像处理性能可达上代的4倍,但功耗基本不变。jqw28资讯网——每日最新资讯28at.com

比如智慧城市,往往需要大量摄像头和视频,可以为边缘AI设备缩小30%的占板面积,比并支持2倍的视频流,也就是每路视频流占板面积缩小多达65%。jqw28资讯网——每日最新资讯28at.com

再比如视频流,一般用于专业音视频和广播场景,可实现非常高精度的流量,每秒约60帧,相比于之前的Zyng MPSoC可提供2倍的视频处理能力,每路视频流占板面积也缩小35%。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

两代产品性能级别对比,可以看到没有任何交叉重叠,可以互为补充、针对不同应用和场景jqw28资讯网——每日最新资讯28at.com

上一代产品更多的是边缘传感器后者CPU计算卸载,二代产品则主要是中央计算。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

合作案例方面,斯巴鲁已选择第二代Versal AI Edge系列,用于其下一代高级辅助驾驶(ADAS)的视觉系统“EyeSight”。jqw28资讯网——每日最新资讯28at.com

该系统会集成于斯巴鲁的部分车型,实现先进安全功能,包括自适应巡航控制、车道保持辅助、预碰撞制动等等,致力于实现全年消除致命性道路事故的安全目标。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

第二代Versal Prime系列结合了面向传感器处理的可编程逻辑,以及高性能嵌入式Arm CPU,可以为传统的非AI嵌入式系统提供端到端加速。jqw28资讯网——每日最新资讯28at.com

它也能提供多10倍与初代产品的标量算力,高效执行传感器处理、复杂标量工作负载。jqw28资讯网——每日最新资讯28at.com

同时,得益于针对8K等高吞吐量视频处理的全新硬 IP,第二代Versal Prime系列非常适合超高清视频流与录制、工业PC等应用。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

AMD第二代Versal AI Edge系列、第二代Versal Prime系列将于2025年上半年提供样品,2025年年中提供评估套件和系统模块(SOM),2025年年底量产上市。jqw28资讯网——每日最新资讯28at.com

目前,客户和开发者已经可以获取早期访问文档、参与早期使用计划,AMD也正在与主要客户进行接洽。jqw28资讯网——每日最新资讯28at.com

AMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速jqw28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-82416-0.htmlAMD发布第二代Versal自适应SoC:10倍标量性能、全程AI加速

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Intel发布Gaudi 3 AI加速器:4倍性能提升、无惧1800亿参数大模型

下一篇: 酷睿Ultra离开笔记本!第一次独立接口LGA1851、功耗低12W

标签:
  • 热门焦点
  • 石头自清洁扫拖机器人G10S评测:多年黑科技集大成之作 懒人终极福音

    科技圈经常能看到一个词叫“缝合怪”,用来形容那些把好多功能或者外观结合在一起的产品,通常这样的词是贬义词,但如果真的是产品缝合的好、缝合的实用的话,那它就成了中性词,今
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • Java NIO内存映射文件:提高文件读写效率的优秀实践!

    Java的NIO库提供了内存映射文件的支持,它可以将文件映射到内存中,从而可以更快地读取和写入文件数据。本文将对Java内存映射文件进行详细的介绍和演示。内存映射文件概述内存
  • 如何使用JavaScript创建一只图像放大镜?

    译者 | 布加迪审校 | 重楼如果您曾经浏览过购物网站,可能遇到过图像放大功能。它可以让您放大图像的特定区域,以便浏览。结合这个小小的重要功能可以大大改善您网站的用户体验
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • iQOO 11S新品发布会

    iQOO将在7月4日19:00举行新品发布会,推出杭州亚运会电竞赛事官方用机iQOO 11S。
  • 最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

    2022年1月份在国际消费电子展(CES2022)上首次亮相的Alienware新品——Alienware X14现在已经可以购买了,这款笔记本电脑被誉为世界上最薄的 14 英寸游戏笔
Top