AMD和英特尔新的HPC调优CPU技术

专用cpu并不是一个全新的概念。
amazon web services已经表明,云计算的未来不能仅依靠其新型graviton3e芯片的通用芯片,aws将与amd和英特尔一起推出旨在更快、更高效地执行某些应用程序的专用中央处理器。
虽然受益于许多并行工作的内核,计算世界越来越多地开始使用gpu来处理ai训练等工作负载,但英特尔、amd和aws发现为一些对企业、政府、政府和组织都很重要的数据密集型应用程序定制cpu的好处。
这意味着未来cpu改进的节奏不会那么简单,因为这三家公司很快都会有通用和专用的中央处理器可用。对于具有高性能需求的组织,这将需要对系统配置进行更多审查,因为芯片设计人员希望以新的方式提高性能和效率。
就gravtion3e而言,aws、amd和英特尔最近和即将推出的cpu有着相同的目标——高性能计算——至少在更广泛的层面上是这样。我们谈论的是科学家、工程师和其他数据相关专业人士使用的广泛应用,例如计算流体动力学、天气建模和分子动力学等。
aws本周表示,graviton3e非常适合hpc应用程序,因为它针对浮点和矢量数学进行了优化。aws执行官peter desantis声称,与今年早些时候开始为实例提供动力的通用graviton3相比,这种微调使基于arm的芯片在生命科学和金融建模工作负载的基准测试中运行得更快。
虽然aws没有透露有关graviton3e的许多细节,但我们可以看看来自amd和英特尔的新的hpc调优cpu,以了解如何调整通用芯片以使一组应用程序受益。
amd提升缓存以服务于技术计算应用程序
今年早些时候,amd推出了一款全新的epyc服务器芯片,代号为milan-x,旨在加速hpc中的应用程序。目标工作包括电子设计自动化、计算流体力学、有限元分析和结构分析模拟,amd将其置于“技术计算”的保护伞之下。
milan-x芯片的批量定价比普通的具有类似特性的第三代epyc处理器“略有溢价”,但amd表示,由于cpu上融合了大量缓存,用户可以期待目标工作负载的性能大幅提升。额外的性能以768mb的l3高速缓存的形式出现,是2021年推出的通用第三代通用epycs的三倍。这意味着双插槽服务器的l3缓存总量可以超过1.5gb。
扩大的l3高速缓存允许cpu在靠近处理器核心的地方存储更多的数据,这对于经常移动大量数据的技术计算工作负载非常重要。amd声称16核milan-x芯片每小时可以为synopsys用于芯片设计的vcs软件执行40.6个任务。相比之下,amd的同一代16核epyc每小时只能完成24.4个任务,使得milan-x芯片的速度提高了66%。
该公司还声称,milan-x的运行速度比英特尔去年推出的第三代至强可扩展芯片快23-88%,适用于各种技术计算应用。
英特尔通过高带宽内存应对hpc
英特尔还在解决让更多数据更靠近hpc应用程序内核的问题,除了没有创建更大的缓存,该公司还设计了一款具有64gb高带宽内存的cpu。这是指英特尔即将推出的xeonmax系列处理器,它们是明年初推出的sapphirerapids服务器芯片的hpc变体。
英特尔表示,至强max芯片的性能将优于其第三代至强可扩展处理器和amd的milan-x芯片,适用于广泛的hpc应用程序。它通过展示近20个hpc基准来做出这一声明,最高的xeonmax芯片的性能比上一代处理器高出20%至近5倍。
通过将64 gb的高带宽内存直接放入芯片中,英特尔在服务器配置方式上也提供了更大的灵活性。例如,数据中心操作员只需依赖xeonmax的高带宽内存,就可以完全放弃服务器中的dram,而无需进行代码更改。这反过来又有望降低购买内存dimm及其能源成本的相关成本。
xeonmax还可以与高带宽内存一起使用dram来扩展整个系统的内存,尽管这需要在软件中进行代码更改。或者,用户可以配置xeonmax的高带宽作为ddr的缓存,而ddr不需要任何代码更改。
虽然增加的高带宽内存是xeonmax的决定性特性,但处理器还有其他的功能来增强某些hpc和ai应用,如英特尔深度学习助推器、英特尔数据流加速器和英特尔高级矩阵扩展。
碎片化处理的未来
专用cpu并不是全新的概念。英特尔一直在大量生产针对电信工作负载进行优化的至强处理器。但这批新产品代表了一个更大的浪潮,即将到来的中央处理器将不会被设计为服务于尽可能广泛的应用程序。
英伟达(nvidia)计划在明年年初发布基于arm的grace cpu,用于hpc和人工智能。另一方面,amd正在开发未来几代epyc芯片,这些芯片不仅针对hpc进行了优化,还针对边缘和电信工作负载进行了优化。英特尔和amd都在开发为云计算优化的cpu。
我们需要考虑英特尔、nvidia和amd正在研究如何让cpu和gpu之间的距离更近一些,用于需要大量马力的应用程序。对于英伟达来说,这将在明年以grace hopper superchip的形式出现。英特尔计划在2024年通过其falcon shoresxpu实现这一目标。与此同时,amd打算在明年推出的instinct mi300芯片上实现这一点。


浅谈“超级蜂群”无人机作战项目开发的技术核心
困扰5000万人的睡眠呼吸暂停,华为WATCHGT3这样破解
销售光电子产品的厂商主导了O-S-D供应商TOP 10排行榜
工业智能相机—集成视觉检测软件的CCD工业相机
乐视S3爵迹版618售价999,联发科X20+4G内存,性价比不亚于小米!
AMD和英特尔新的HPC调优CPU技术
5G和媒体融合商业模式创新将带来变革的发展机遇
曝巴斯夫将斥资5亿欧元在勃兰登堡建立电池厂 预计将雇用近8000名员工
关于光伏监控系统在光伏电站运营中的作用及发展
用于低温锂离子电池的超润湿性高电压LiCoO2
深度视觉系统解决方案|多相机检测|高速视觉检测|视觉引导定位
三星全新电视即将发布,彻底消除了物理边框
小米6测评:用起来的实际效果,看完你就知道要不要买了!
GGII:2025国内锂电中段装配设备市场规模预计达245亿元
全球首列由光电磁数字化导向的胶轮低地板列车正式发布
HTC Vive专属无线套件,TPCAST Vive让VR体验从此再无线材束缚!
最具人气的6部智能手机盘点,你准备入手哪台?
现在什么手机好用些?2018手机各价格区间畅销机型排行榜告诉你答案
晶体管和三极管有什么区别
联想拯救者Y9000K 2020款信息披露,将会搭载15.6英寸屏幕