当前位置:首页 > 科技  > 芯片

1:1:1,浪潮信息的AIGC新答卷

来源: 责编: 时间:2023-09-11 22:34:48 389观看
导读此前我们说过,AS13000融合存储系统是浪潮信息应对AIGC存储的答卷,针对Token、也好,Checkpoint也好,AS13000通过数控分离架构,减少东西向数据量的转发;通过GDS、RMDA技术缩短I/O路径,通过SPDK、缓存零拷贝技术减少I/O路径上的

此前我们说过,AS13000融合存储系统是浪潮信息应对AIGC存储的答卷,针对Token、也好,Checkpoint也好,AS13000通过数控分离架构,减少东西向数据量的转发;通过GDS、RMDA技术缩短I/O路径,通过SPDK、缓存零拷贝技术减少I/O路径上的数据拷贝,以及基于自研NVMe SSD开发的盘控协同技术,减少I/O访问SSD盘的次数,使存储性能得到进一步释放。AS13000全闪单节点带宽超过50GB/s,IOPS超过50万;此外,创新性地引入双控全闪节点,带宽超100GB/s,IOPS超100万,真正使系统具备千万级IOPS、EB级带宽,充分满足AIGC场景对存储系统的苛刻要求。Set28资讯网——每日最新资讯28at.com


在8月末,在杭州举行的2023全球闪存峰会期间,浪潮信息重磅发布了高性能分布式存储平台,AS15000G7将AIGC存储又带到了一个新的台阶,与此同时,浪潮信息发布了数据中心算力、全闪、混闪,1:1:1黄金比例建设的原则。Set28资讯网——每日最新资讯28at.com



浪潮信息存储产品线副总经理刘希猛表示:“当前,各个厂商纷纷投资硬件,训练自己的大模型,国内已发布的生成式AI模型超过了100个,‘百模争秀’的格局初现,云厂商和运营商对IT硬件的投资往往是成千上万节点规模,而行业大厂投资在几百节点规模,在建设布局时考虑到AI大模型对高性能AI服务器、高吞吐并行存储系统、低延迟RDMA网络的严苛需求,将数据中心的算力、全闪、混闪按照1:1:1黄金比例建设,可实现用户整体投入最小化。”Set28资讯网——每日最新资讯28at.com


“一台8卡最先进GPU服务器后端配置的存储节点写带宽要求20GB/s,读带宽要求40GB/s,通常一台全闪存储节点的写带宽是20GB/s,读带宽接近30GB/s,可得到计算节点与全闪节点的数量比例接近1:1。按着数据使用规律,通常热数据和温冷数据的容量配置约为1:10,即全闪单节点容量为50~100TB,混闪节点容量为500~1000TB,全闪节点与混闪节点的数量比例接近1:1。” 刘希猛说。Set28资讯网——每日最新资讯28at.com


“我们建议用户整体规划布局,避免在存储扩容、数据迁移和数据管理方面随着业务的增加而力不从心,因此按照算力、全闪、混闪节点数量配比1:1:1来设计规划和部署是目前的最优方案。” 刘希猛继续补充说。Set28资讯网——每日最新资讯28at.com


分布式存储产品线总经理姜乐果表示:AS15000G7是在AS13000基础上的升级迭代,如果说AS13000的特点是极致融合,那么AS15000G7的特点则是极致性能。Set28资讯网——每日最新资讯28at.com


AS15000G7采用高吞吐并行存储系统,通过GDS、RDMA技术缩短I/O路径;通过智能元数据管理,提前缓存用户数据和文件系统元数据,显著提升数据访问和检索速度;独有的智能网络优化技术,可实现多个子网与指定目的地通信,每对守护进程之间建立多个TCP连接并通信,显著提升网络端口并发能力,实现传输端口带宽翻数倍,时延缩短50%以上,小文件级传输的时延可降至毫秒级。Set28资讯网——每日最新资讯28at.com



以GDS(GPU Direct Storage)为例,能够将GPU和外部数据存储的带宽提升2~8倍,当GPU并发度增加的时候,GDS仍然能够保持稳定的低延迟输出,非常适用于AIGC等AI应用场景的应用。通过对于GDS的支持,GPU直接访问存储,从而避免了传统设计应用中,CPU调度带来的访问延迟。可以说,GDS也好,RDMA也好,对于新的访问协议的支持,已经成为了分布式文件系统的基本功,也是追求极致性能的必由之路。Set28资讯网——每日最新资讯28at.com


AS15000G7提供了自动化的数据分层和迁移的功能,从而为满足AIGC场景应用提供了更好的支持,因为除了高速并行访问能力之外,AIGC训练、推理中的中间结果数据需要存储和保留,很多都是以冷数据形式呈现,也更加适合混闪阵列的定位,这也是浪潮信息提出全闪、混闪1;1的原因。AS15000G7在产品设计上充分考虑到了这一点,提供了通用型、容量型和性能型的产品类型。通过基于闪存、磁盘、磁带、光盘的灵活配置,可最大程度降低用户的整体投入。Set28资讯网——每日最新资讯28at.com


AS15000G7新品同时搭载了AIStation调度平台和InView数据管理平台,通过对AI服务器、网络、存储的智能运维,提高多租户管理、资源分配、数据管理分析的能力和水平。与此同时,AS15000G7保留了多协议实时互访互通和系统扁平扩展的能力,从而能够实现对于多元异构非结构化数据,如文本、图片、音频、视频等,以及文件、对象、大数据以及视频文件的高效共享。Set28资讯网——每日最新资讯28at.com


“1:1:1,也许这样配置比较奢侈,很少有用户能够达到这样的配置,那是因为没有考虑到混合模态、多模态训练的需要。” 刘希猛说。Set28资讯网——每日最新资讯28at.com


icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

本文链接:http://www.28at.com/showinfo-27-9194-0.html1:1:1,浪潮信息的AIGC新答卷

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 充电?换电?未来补能谁说得算

下一篇: 英特尔宣布与高塔半导体达成新代工协议

标签:
  • 热门焦点
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • Flowable工作流引擎的科普与实践

    一.引言当我们在日常工作和业务中需要进行各种审批流程时,可能会面临一系列技术和业务上的挑战。手动处理这些审批流程可能会导致开发成本的增加以及业务复杂度的上升。在这
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 微软邀请 Microsoft 365 商业用户,测试视频编辑器 Clipchamp

    8 月 1 日消息,微软近日宣布即将面向 Microsoft 365 商业用户,开放 Clipchamp 应用,邀请用户通过该应用来编辑视频。微软于 2021 年收购 Clipchamp,随后开始逐步整合到 Microsof
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • 滴滴违法违规被罚80.26亿 共存在16项违法事实

    滴滴违法违规被罚80.26亿 存在16项违法事实开始于2121年7月,历经一年时间,网络安全审查办公室对“滴滴出行”网络安全审查终于有了一个暂时的结束。据“网信
  • 利用职权私自解除被封帐号 Meta开除20多名员工

    11月18日消息,据外媒援引知情人士表示,过去一年时间内,Facebook母公司Meta解雇或处罚了20多名员工以及合同工,指控这些人通过内部系统以不当方式重置用户帐号,其
Top