NVIDIA扩大AI推理性能领先优势,首次在Arm服务器上取得佳绩

最新mlperf基准测试表明,nvidia已将其在ai推理性能和能效方面的高标准扩展到arm以及x86计算机。
根据今日发布的基准测试结果,nvidia在使用x86及arm cpu进行ai推理时取得了最佳成绩。
这是nvidia连续第三次在mlcommons推理测试中创造性能和能效纪录。mlcommons是一家成立于2018年5月的行业基准测试组织。
这场测试是第一次在arm系统上进行数据中心类别的测试,这使用户在部署ai这一目前最具变革性的技术时有了更多的选择。
无与伦比的性能
在最新一轮测试中,由nvidia ai平台驱动的系统在所有七项推理性能测试中都名列前茅,这些系统来自nvidia和其九家生态系统合作伙伴,包括阿里巴巴、戴尔科技、富士通、技嘉、慧与、浪潮、联想、宁畅和超微。
nvidia是唯一一家在本轮和迄今为止每一轮测试中取得所有mlperf测试结果的公司。
推理(inference)指计算机通过运行ai软件来识别对象或进行预测。在这个过程中,计算机使用深度学习模型来过滤数据,进而发现人类所无法捕捉的结果。
mlperf推理基准测试基于当今最常用的ai工作负载和场景,涵盖计算机视觉、医学影像、自然语言处理、推荐系统、强化学习等。
因此,无论用户部署何种ai应用,都可以通过nvidia创造自己的纪录。
为什么性能十分重要
随着ai用例从数据中心扩展到边缘和其他领域,ai模型和数据集将不断增加。就是为什么用户需要既可靠又能灵活部署的性能。
mlperf让用户有信心做出明智的购买决定。该组织得到了几十家行业领导者的支持,包括阿里巴巴、arm、百度、谷歌、英特尔和nvidia,因此这些测试是透明的和客观的。
将arm灵活应用于企业ai
凭借在能效性能上的不断增长和不断扩展的软件生态系统,arm架构正在向全球各地的数据中心进军。
最新基准测试表明,作为gpu加速的平台,在ai推理工作中,使用ampere altra cpu的arm服务器与具有类似配置的x86服务器提供的性能几乎相同。事实上,在其中的一项测试中,arm服务器的性能甚至超过了类似配置的x86系统。
nvidia一直以来支持所有类型的cpu架构,十分高兴地看到arm在同行评审的行业基准测试中能够证明其ai性能。
arm高性能计算和工具高级总监david lecomber表示:“作为mlcommons的创始成员,arm致力于通过创建标准和基准来更好地应对挑战并激发加速计算行业的创新。”
“最新推理结果表明,arm cpu和nvidia gpu驱动的arm系统已能够应对数据中心中的各种ai工作负载。”
nvidia合作伙伴展示其ai性能
nvidia ai技术得到了广大和日益扩展的生态系统的支持。
在最新基准测试中,七家oem厂商共提交了22个gpu加速的平台。
这些服务器中的大多数型号都是nvidia认证系统,经验证可以运行多种加速工作负载,而且其中很多型号都支持上个月正式发布的nvidia ai enterprise软件。
参与本轮测试的合作伙伴包括戴尔科技、富士通、慧与、浪潮、联想、宁畅、超微以及云服务提供商阿里巴巴。
软件的力量
nvidia能够在所有ai用例中取得成功的一个关键因素是其完整的软件栈。
在推理方面,这包括针对各种用例的预训练ai模型。nvidia tao toolkit运用迁移学习为特定应用定制这些模型。
nvidia tensorrt软件对ai模型进行了优化,使其能够最有效地运用内存并且实现更快的运行速度。nvidia经常使用该软件进行mlperf测试,该软件可用于x86和arm的系统。
在这些基准测试中,nvidia还采用了nvidia triton 推理服务器软件和多实例gpu(mig)功能。它们为所有开发者提供了通常需要专家级程序员才能实现的性能。
随着该软件栈的不断改进,与四个月前的mlperf推理基准测试相比,nvidia提升了高达20%的性能和15%的能效。
nvidia在最新测试中所使用的所有软件都可以从mlperf资源库中获得,因此任何人都可以重现nvidia的基准测试结果。nvidia会陆续将这些代码添加到nvidia的深度学习框架和容器中,用户可在nvidia的gpu应用软件中心ngc上获得这些框架和容器。
其作为全栈式ai平台的一部分,支持所有主要的处理器架构,已在最新行业基准测试中得到了验证,并可通过多家合作伙伴获取,助力客户应对当今的实际ai工作任务。

涡轮流量计的安装规范与维护指南
设计工业连接器的七个要点
SiC器件不同湿法腐蚀工艺的腐蚀机理和应用领域
量子点电致发光处于研究阶段 未来五年市场升温
ppi转以太网与IFIX以太网通讯的方案说明
NVIDIA扩大AI推理性能领先优势,首次在Arm服务器上取得佳绩
大疆无人机在其新型DJI Zenmuse XT2中融入FLIR热成像传感器技术
航天器低频电缆网的电连接器的功能和选择
泰克示波器探头校准的重要性及步骤详解
简述什么是芯片及其作用领域
sram作用
雷凌科技展首款Wi-Fi+蓝牙3.0整合解决方案
关于FPGA基础知识的一些科普问答
三星S20的一亿像素很厉害吗 简单了解一下相机的成像原理
闻泰科技:海外市场空间巨大 将助中国手机厂商未来5年海外拓展
企业的HSE管理系统:保障生产安全与可持续发展
Sierra Wireless推Legato平台 助力嵌入式应用程序开发
人脸检测技术的发展方向
继消毒机器人后,京港地铁近期上线了变电所智能巡检机器人
序列发生器是什么_序列发生器设计步骤