浪潮AI服务器NF5488A5一举创造18项性能纪录

美国东部时间10月21日,全球备受瞩目的权威ai基准测试mlperf公布今年的推理测试榜单,浪潮ai服务器nf5488a5一举创造18项性能纪录,在数据中心ai推理性能上遥遥领先其他厂商产品。
mlperf是当前全球最具影响力的ai计算基准评测组织,由图灵奖得主大卫·帕特森(david?patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球ai训练和ai推理性能测试并发榜。此次mlperf的ai推理基准测试有全球23家公司和单位参与,在数据中心及边缘等场景进行ai计算产品的性能比试。今年mlperf训练榜单已于7月公布。
浪潮nf5488a5获数据中心ai性能绝对优势
此次浪潮nf5488a5一举创造18项mlperf推理性能纪录,成为创纪录最多的ai服务器。今年的测试中,数据中心ai性能最受关注,全部参与机构提交了507项性能测试数据。浪潮nf5488a5创下了数据中心22个赛项中的13项性能纪录以绝对优势领先,nvidia dgx取得了5项数据中心性能纪录。而在此前的mlperf训练榜单中,nf5488a5在最核心的resnet50训练任务中也创下了性能纪录,单机性能高居榜首。
浪潮nf5488a5创造18项mlperf推理性能纪录
性能大幅提升3倍,全栈ai能力优势凸显
在此次基准测试中,浪潮ai服务器nf5488a5在开放优化(open)和固定任务(closed)的resnet50基准性能测试中,均表现优异,相比2019年mlperf推理榜单的服务器最好性能提升高达3倍。
mlperf resnet50推理性能2019 vs 2020对比
nf5488a5是浪潮自研的新一代ai服务器,是此次mlperf全球竞赛中唯一可以在4u空间内支持8块安培架构a100芯片实现nvlink高速互联的ai服务器。浪潮nf5488a5在系统拓扑上采用了超低延迟设计,支持pcie 4.0全链路极致优化,高频通信单元采用一级拓扑最近连接,最大限度提升处理器到ai芯片间的通信性能。同时,通过配置numa节点,确保每颗处理器与其直连的gpu之间通信性能最优,最大限度降低通信延迟。此外,nf5488a5通过深度优化系统结构设计,确保设备可在高温环境下稳定运行。
本次基准测试中,浪潮展示出了卓越的ai计算软硬件协同优化能力。在硬件层面,通过对cpu、gpu硬件性能的精细校准和全面优化,使cpu性能、gpu性能、cpu与gpu之间的数据通路均处于对ai推理最优状态;在软件层面,结合gpu硬件拓扑对多gpu的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合gpu tensor core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。
各服务器mlperf ai推理性能对比(以浪潮nf5488a5为基准,越高越好)
浪潮是全球领先的ai计算领导厂商,其ai服务器在中国的市场份额已连续三年保持在50%以上。浪潮致力于ai计算平台、资源平台和算法平台的研发创新,并通过元脑生态与ai领先企业共同推进ai产业化和产业ai化进程。


混合信号设计需要避免的两种情况
桁架机器人执行部分解说
电压不稳老烧东西是什么原因
Magic Leap One曝光两款虚拟现实新应用,界面逼真程度让人惊讶
怎样选择合适的电容
浪潮AI服务器NF5488A5一举创造18项性能纪录
CPCI总线实现实时图像信号处理平台设计
PLC程序设计常用方法总结
超极本=超级难卖?超极本不是“救世主”!
iPhone7/7Plus销量暴跌,辉煌不再,中国红也救不了苹果了
制作一个优质PCB的最佳技巧
比特币的起源谜团
当AI开始保护TA
伺服电机十大故障分析(二)
万用表能否测量nA级别信号
德州仪器推出在线工具WEBENCH系统电源建筑师
根据PCI总线的实时测频卡WDM驱动程序设计策略
虚拟现实技术都用在了哪些方面
微软新款 Xbox 外接硬盘要求公布:USB 3.0,128GB
LPC553x/S3x MCU系列功能简介