在400亿美元收购arm的6个月后,nvidia连发三款基于arm ip打造的处理器,包括全球首款专为tb级加速计算而设计的cpu nvidia grace、全新bluefield-3 dpu,以及业界首款1000tops算力的自动驾驶汽车soc。此外,还公布了与亚马逊aws、ampere computing、联发科和marvell等基于arm的cpu平台的合作伙伴关系。
黄仁勋表示:“我们每年都会发布激动人心的新品。三类芯片,逐年飞跃,一个架构。”nvidia数据中心路线图包括cpu、gpu和dpu这三类芯片,每个芯片架构历经两年的打磨周期(周期内可能出现转变),一年专注于x86平台,另一年专注于arm平台。
grace:专为大型应用建立的数据中心cpu
专攻gpu的英伟达在这次gtc大会上推出了基于arm架构的中央处理器(cpu)—— grace,用于大规模人工智能和高性能计算应用。
黄仁勋表示,“这是英伟达第一个数据中心cpu,专为大型应用建立”。
这款cpu以美国海军少将、计算机编程先驱grace hopper的名字命名。grace hopper是计算机科学的先驱之一,也是哈佛mark 1的第一批程序员和第一个链接器的发明者。她在20世纪50年代开创了计算机编程,发明了世界上第一个编译器,被称为“计算机软件工程第一夫人”。
这款名为grace的cpu使用了节能 arm 核心—— neoverse,为系统训练大型人工智能模型提供了巨大的性能飞跃,每个cpu能在specrate2017_int_base基准测试中分数超过300分。
具体讲,基于grace的系统与nvidia gpu紧密结合,性能将比目前最先进的nvidia dgx系统(在x86 cpu上运行)高出10倍。
它能够满足世界上最先进应用的计算需求,包括自然语言处理、推荐系统和人工智能超级计算,这些应用分析需要超快计算性能和大容量内存中的巨大数据集。
grace还是一款高度专用型处理器,主要面向大型数据密集型hpc和ai应用。新一代nlp模型的训练会有超过一万亿的参数。
这款cpu的基本性能是第四代nvidia nvlink互连技术,从cpu到gpu连接速度超过900gb/s,达到相当于目前服务器14倍的带宽;从cpu到cpu的速度超过600gb/s。
拥有最高的内存带宽,采用的新内存lpddr5x技术,带宽是lpddr4的两倍,能源效率提高了10倍,能提供更多计算能力。
英伟达表示,新产品将于2023年初上市。
黄表示,使用经过授权的 arm ip,英伟达将 grace 设计成专门用于大规模人工智能和高性能计算的 cpu。
作为首批客户,瑞士超级计算中心(cscs)和美国洛斯阿拉莫斯国家实验室(los alamos national laboratory)将是第一个使用由惠普打造的grace驱动的超级计算机的机构。
grace将为世界上最快的超级计算机提供驱动力。这台被称为阿尔卑斯山的超算将具有20亿亿次浮点运算的能力。
这比当今领先的人工智能超级计算机——2.8亿亿次运算的 nvidia seline 超级计算机的计算能力高出约7倍。
基于arm架构的新数据中心cpu nvidia grace的发布,或将直接挑战英特尔在服务器和数据中心计算领域的主导地位,抢占英特尔最赚钱的市场领域。
bluefield-3 dpu:220亿晶体管
在黄仁勋看来,负责在数据中心传输和处理数据的数据处理单元(dpu),正与cpu、gpu共同组成“未来计算的三大支柱”。
他宣布nvidia bluefield-3 dpu包含220亿个晶体管,采用16个arm a78 cpu核心、18m iops弹性块存储,加密速度是上一代的4倍,并完全向下兼容bluefield-2。将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。
这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。
bluefield-2能够卸载相当于30个cpu核的工作负载,而bluefield-3实现了10倍的性能飞跃,能够替代300个cpu核,以400gbps的速率,对网络流量进行保护、卸载和加速。
业界首款1000tops算力的自动驾驶汽车soc
nvidia drive atlan是nvidia新一代车载系统级芯片,为汽车带来真正的数据中心。
atlan可以达到每秒超过1000万亿次(tops)运算次数,约是上一代orin处理器的4倍,超过了绝大多数l5无人驾驶出租车的总计算能力。
这是drive平台首次集成dpu,通过arm核为自动驾驶汽车带来数据中心级的网络,致力于应用到2025年的车型。
该soc采用下一代gpu的体系结构、新型arm cpu内核、新深度学习和计算机视觉加速器,并内置为先进的网络、存储和安全服务的bluefield dpu,网络速度可达400gbps。
黄仁勋夸赞说:“atlan集nvidia在ai、汽车、机器人、安全和bluefield安全数据中心领域的所有技术之大成,堪称一项技术奇迹。”
软硬件双管齐下,便捷式ai数据中心和dgx superpod双升级
软硬件双管齐下,黄仁勋宣布升级nvidia专为工作组打造的“便携式ai数据中心”——nvidia dgx station,以及nvidia专为密集型ai研发打造的ai数据中心产品——nvidia dgx superpod。
全新dgx station 320g借助320gb超快速hbm2e连接至4个nvidia a100 gpu,内存带宽达到每秒8tb。然而,仅需将其插入普通的壁装电源插座即可使用,耗电量只有1500瓦。
dgx superpod使用全新80gb nvidia a100,将其hbm2e内存提升至90tb,实现2.2eb/s的总带宽。要实现如此的带宽,需要11000台cpu服务器,大约相当于有250个机柜的数据中心,比superpod多15倍。
目前它已经升级至采用nvidia bluefield-2,且nvidia如今还为该产品提供配套的nvidia base command dgx管理和编排工具。
nvidia drive orin:汽车的中央大脑
黄仁勋表示,自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一,同时也是最棘手、影响最大的挑战之一。”
黄仁勋表示,将于2022年投产的nvidia自动驾驶汽车计算系统级芯片——nvidia drive orin,旨在成为汽车的“中央电脑”。
此次黄仁勋还推出了hyperion 8 av平台,包括参考传感器、自动驾驶汽车和中央计算机、3d地面真实数据记录仪、网络以及所有必要的软件。
并宣布沃尔沃汽车扩大与nvidia的合作。
沃尔沃从2016年开始应用nvidia drive的算力,基于nvidia drive xavier,为新车型开发ai辅助驾驶功能,软件则由沃尔沃汽车旗下的自动驾驶软件开发公司zenseact自主研发。
沃尔沃新一代汽车的自动驾驶计算机将配备nvidia drive orin。
这也是英伟达和合作伙伴致力推广的“软件定义车型”的概念。
黄仁勋还宣布drive sim将于今年夏季开放供业界使用。
爆款风扇灯无刷电机驱动控制板推荐
把橡塑解决方案提升至更高层次 CHINAPLAS 2023 国际橡塑展同期活动前瞻(下)
新世代天籁2.5XL 领先版C-NCAP碰撞测试结果分析
我国光器件产业发展迅速,涌现陕西源杰科技、武汉敏芯等企业
电池行业重新洗牌,固态电池将迎来爆发吗
英伟达便捷式AI数据中心和DGX SuperPod双升级
语音识别芯片在儿童安全椅上的应用方案——NRK3301
小米MIX悄然现货开卖,比小米6更值得买!
TIOBE 9月TOP 20编程语言
阿法狗2.0版来了!这次AI就只靠技术不要棋谱
博世通过数字化转型加速产品质量提升
年度旗舰华为P10发布,颜值爆炸!
通用汽车电动车型将共享Ultium动力系统,可允许通用汽车简化生产
恭喜科雅无线充CBB电容被苹果供应链选用
IQ正交调制及星座图
理想智造ONE已完成两轮工程试制 即将亮相等待检验
ChatGPT移动端收入再创新高,接近饱和?
AI作画升级,OpenVINO™ 和英特尔独立显卡助你快速生成视频
智慧系统解决方案商盛视科技拟IPO:2018年毛利率高达51.35%
Ryzen 7 2700X处理器曝光,7核14线程?