下一代Arm服务器CPU内核:Neoverse V2和E2

三年多以前,arm宣布了他们的neoverse系列基础架构cpu设计。决定通过专门为这些市场设计arm cpu内核来加倍投入服务器和边缘计算市场——而不仅仅是回收以消费者为中心的cortex-a设计——arm开始以更加积极的方式应对基础设施市场。反过来,这些努力也为arm及其合作伙伴带来了越来越多的回报,多亏了亚马逊的graviton和ampere altra cpu等产品,他们终于能够在服务器cpu市场上占据一席之地。
但随着arm cpu最终实现了过去十年未能实现的市场渗透,arm需要确保它不会固步自封。在公司的三个neoverse核心设计系列中——高效的e、灵活的n 和高性能的v——公司已经在其第二代n核心上,恰当地称为n2。现在,该公司正准备用下一代v和e内核更新neoverse的其余产品线,这次宣布推出neoverse v2和neoverse e2内核。这两种设计都计划将armv9架构带给hpc和其他服务器客户,并显著提高性能。
arm neoverse v2:armv9 助力高性能计算
引领arm新cpu内核ip的是该公司的第二代v系列设计neoverse v2。代号为demeter的完整v2平台标志着arm对其高性能v系列内核的首次迭代,以及该内核阵容从armv8.4 isa向armv9的过渡。虽然这只是arm在服务器专用高性能内核方面的第二次尝试,但请不要误会:arm有雄心勃勃的目标。该公司声称 neoverse v2 cpu将提供市场上最高的单线程整数性能,超过amd和英特尔的下一代设计。
虽然本周arm发布的公告并不是对新架构的全面深入研究——更令人恼火的是,该公司并没有谈论具体的ppa指标——但arm提供了一个高层次的视角,介绍了v2平台将带来的一些变化和功能。可以肯定的是,v2 ip已经完成并在今天交付给客户(最著名的是nvidia),但arm在2023年第一批基于ip的芯片交付之前,在某种程度上对他们关于v2的说法有所隐瞒。
首先,armv9的升级带来了最新arm架构附带的全套功能。这包括作为架构基石功能的安全改进(尤其适用于云共享环境)以及arm较新的sve2矢量扩展。
对于后者,arm通过重新配置矢量引擎的宽度,在这里做出了一个有趣的改变;v1使用2管道256位simd实现sve(1),而v2移动到4管道128位simd。最终结果是,v2的累积simd宽度不比v1宽,但执行流程已更改为并行处理更多的较小向量。这一变化使simd管道宽度与arm的cortex部分相同(均为128位,sve2的最小尺寸),但这确实意味着arm不再通过使用更大的simd来充分利用sve的可扩展部分。我希望一旦他们进行完整的v2深入研究,我们就会知道为什么arm会走这条路,因为我很好奇这是否纯粹是一种效率游戏,或者更类似于整个arm生态系统的同质化设计。
除此之外,值得注意的是,虽然arm的演示幻灯片将bfloat16和int8 matmul列为功能,但这些并不是新功能。尽管如此,arm仍然承诺v2的simd处理将提供比v1更高的微架构效率。
更广泛地说,v2还将引入更大的l2缓存大小。v2设计支持每个核心最多2mb的私有l2缓存,是v1最大容量的两倍。v2还将进一步提高arm的整数处理性能,尽管公司目前不打算进一步详细介绍。从架构的角度来看,v1借鉴了cortex-x1 cpu的设计,如果v2借鉴了x2的设计,这也就不足为奇了。在这种情况下,snapdragon 8 gen1和dimensity 9000这样的消费芯片应该提供了一定的参考。
对于demeter平台,arm将重新使用其cmn-700网状fabric,其首次引入v1代。cmn-700仍然是一种现代网状设计,在12x12配置中支持多达144个节点,并且适合与ddr5内存以及pcie 5/cxl 2接口以进行i/o。因此,严格地说,v2并没有在结构层面带来任何创新——即使是512mb的slc也可以通过v1+cmn-700设置完成——但这确实意味着cmn-700mesh及其功能现在是v2的基础。
反过来,neoverse v2核心将成为下一代高性能arm服务器cpu的基石。事实上,这里的旗舰将是nvidia的grace cpu,这将是2023年第一款(如果不是第一款)v2设计。nvidia之前宣布grace将基于neoverse设计,因此本周arm的声明最终证实了长期以来的怀疑,即grace将以下一代neoversev核心为基础。
就nvidia而言,他们的秋季gtc活动计划在几天内举行。因此,我们很可能会听到更多关于grace及其neoverse v2基础的信息,因为nvidia希望在明年发布之前推广该芯片。
neoverse e2:cortex-a510用于n2
除了neoverse v2的发布,arm还利用本周的简报发布了neoversee2平台。与v2版本不同,这是一个规模小得多的公告,arm只提供了一些技术细节。最终,e2投入使用的日子即将到来。
也就是说,e2平台正在交付给合作伙伴,着眼于与现有n2平台的互操作性。为此,arm将cortex-a510 cpu与arm的小型/高效cortex cpu核心配对,并将其与cmn-700网格配对。这旨在为服务器运营商/供应商提供更多灵活性,为n2提供替代cpu核心,同时仍提供arm mesh的现代i/o和内存功能。强调这一点,e2系统背板甚至与n2背板兼容。
neoverse next: poseidon, n-next, and e-next
最后,arm本周发布的公告为公司所有三个neoverse平台的未来路线图提供了一些信息,毫不奇怪,arm正在开发每个平台的更新版本。
值得注意的是,所有三种平台都要求支持pcie 6支持以及cxl 3.0。这将来自arm的cmn网格网络的下一次迭代,正如arm今天已经做的那样,它在所有三个平台之间共享。
同时,有趣的是,看到poseidon的名字再次出现在arm的路线图中。回到arm的第一个neoverse路线图,poseidon是附在arm的5mn/2021平台上的名字,自n2和v1/v2以各种形式出现以来,poseidon就是一个位置。由于v2直到2023年才在硬件上登陆,poseidon/v3还需要几年时间,但arm保留代号(例如新的微体系结构)可能有一定的意义。
但首先推出的将是n-next平台——可能的neoverse n3。随着neoverse n平台领先其他平台一代(n2于2020年首次宣布),它将是下一个更新的平台。n3将于2023年提供给合作伙伴,arm广泛宣传新一代的性能和效率改进。


5G行业将迎来布局窗口,物联网和云游戏应用端前景可观
华为聚焦6大通用终端能力,形成“3+6+X”的5G应用体系2.0版本
镭神智能完成数亿元D轮融资,进一步加大激光雷达技术研发
技术攻关:区块链技术创新应用在继电保护工作中
积木机器人系列开启了业内实物编程的新时代?
下一代Arm服务器CPU内核:Neoverse V2和E2
使用RT-Thread和CPK-RA2L1采集DHT11温湿度
华为FusionPlant工业互联网平台打造有竞争力的解决方案
光纤微裂纹检测仪测量手机玻璃镜底厚度
振动传感器YTS9512A构成的车辆防盗报警电路
比特币可以成为限制经济的补救措施吗
太阳热水器水位控制的EDA实现
中科大研制出自主知识产权量子计算机控制系统
台积电:美国亚利桑那州第二座晶圆厂投产时间推迟至2027年
独石电容生产工艺
中国工程院院士许祖彦:激光技术为什么是重要战略支撑技术
智慧照明企业华体科技发布2022第一季度报告
在水泥工程机械搅拌行业中称重传感器有哪些广泛应用?
状态机概述 如何理解状态机
多个WS2812灯珠的点亮实验