cpu、gpu和dpu是数据中心的三大芯片,通常情况下:cpu主要用于业务应用的处理,gpu用于性能敏感业务的弹性加速,而dpu则是基础设施加速。站在cpu的视角:一开始所有事情都是我的,然后gpu从我这“抢”过去了一部分工作,现在又出现个dpu来跟我“抢食”。是可忍孰不可忍,必须坚决反击!
01 cpu视角看硬件加速
站在cpu视角,最开始,一切处理都通过处理器cpu的常规指令集完成。随着cpu性能瓶颈,需要硬件加速的方式来提升性能。硬件加速大致有如下几种方式:
方式1:实现支持扩展指令集的协处理器,实现一定程度的加速能力。比如intel集成的avx和amx指令集,arm的neon指令集等。
方式2:独立的单一架构的加速器。比如gpu、ai芯片。
方式3:独立的多架构集成加速器。比如dpu。
方式4:即将开始的一种方式,集成单个或多个加速器。
这里需要大家区分两个概念:处理器核和处理器芯片。处理器芯片是由同构或异构的处理器核组成的。
cpu已经到了性能瓶颈,这是大家的共识;当cpu遇到性能瓶颈的时候,通过加速的方式进一步提升性能,也是大家的共识。但是,加速的实现形态,是分立的多个芯片,还是集成的单个芯片,就是“仁者见仁智者见智”的事情了。独立的dpu公司会认为,独立的dpu有很多的优势;但是在cpu厂家而言,通过cpu集成加速器核,使得cpu成为某种程度上的类soc芯片,也是完全可行的。
02 独立dpu的价值基础并不牢靠
dpu作为独立的集成加速平台,其价值可以从四个方面进行阐述:
价值一:为了进一步提升性能,dpu实现cpu工作任务的卸载和加速;
价值二:从i/o的硬件虚拟化(也可以看做是i/o模拟的硬件卸载)开始,dpu实现i/o模拟、i/o workload以及整个虚拟化和基础设施层的全量卸载和加速;
价值三:从运维和管理视角,dpu重要的价值在于实现了业务和基础设施分离,实现了业务主机的安全访问;
价值四:面向更大计算量和数据吞吐量,dpu实现从“以计算为中心”到“以数据为中心”。
dpu的前三个价值,其实现:可以是独立的dpu芯片实现,也可以是集成的dpu域实现。这对功能和特征没有任何影响,甚至集成的方式,还有一些优势:优化访问效率,提升性能;集成芯片进一步降低成本和功耗。
dpu的第四个价值,一方面,和独立或集成无关,也就是说独立或集成都可以;另一方面,dpu并不一定能够实现以数据为中心的价值。
上面这张图,通常把左边的称为“以计算为中心”,右边的称为“以数据为中心”。然而,这种表述是有问题的。严格来说,左边称为“以cpu为中心”、“以控制为中心”或者“以计算为中心”是可以的,右边这张图称为“以dpu为中心”是合适的,但如果称为“以数据为中心”则是不准确的。“以dpu为中心”并不一定等于“以数据为中心”,“以dpu为中心”,完全可能是“以‘cpu’为中心”,或者说是“以计算为中心”。
最终的结论是:很多dpu其实并非严格意义上的数据驱动处理器,并且即使dpu是数据驱动的,依然无法保证整个计算机系统是完全数据驱动的。
03 intel sapphire rapids cpu介绍
sapphire rapids是intel新一代的数据中心cpu,用于接替ice lake。sapphire rapids相比ice lake,从单个tile变成了4个tile的chiplet集成。
sapphire rapids可以提供更高的单节点性能:
处理器方面,如更高性能的微架构实现、更多的内核数量、amx扩展、多个集成的加速引擎等;
存储方面,如更大的私有/共享缓存、ddr5/hbm等;
i/o方面,如采用pcie 5.0、upi2.0、支持新一代optane等;
chiplet封装:emib总线实现多tile集成。
除了单芯片的性能提升之外,sapphire rapids还提供更高的数据中心整体性能,例如快速vm迁移、更强的遥测能力、更强的i/o虚拟化、缓存和内存性能一致性、新一代qos、cxl1.1、更加的弹性,以及提升资源利用率等等。
而sapphire rapids的最大创新则是:aia。通过aia集成多种加速引擎,包括数据流加速器dsa(data stream accelerator,不是domain specific architecture)、qat等。我们将在接下来的一节对aia详细介绍。
04 intel里程碑:aia
4.1 背景知识:加速器接口/架构
相对于cpu,其他类型的处理器,都可以称为加速处理器,如:gpu、dsa和asic等(fpga需要具体的处理器实现)。这些加速器都是非图灵完备的,因此都需要和cpu组合成host cpu+xpu的异构计算方式工作。
加速器接口,也即加速器呈现给host cpu的软件访问接口,也可以称为加速器架构。在这里,架构和接口的概念是等同的。
4.2 aia技术介绍
aia(accelerator interfacing architecture,加速器接口架构)不是一个简单的功能或特征实现,而是一组相关技术能力的组合(类比intel的vt-x和vt-d技术)。从intel新一代xeon处理器sapphire rapids开始,提供加速接口技术aia,其技术点包括如下:
任务分配指令(movdiri、movdir64b、enqcmd/s)用于优化任务卸载,enqcmd/s支持共享任务队列;
用户态等待指令(umonitor、umwait、tpause),用于高效同步;
低延迟用户态中断;
共享虚拟内存;
轻量的可扩展i/o虚拟化s-iov。
aia目前支持的加速类型有:数据流处理dsa、加解密和数据压缩qat等。
4.3 intel aia的战略意图分析
作为全能型的处理器,通吃整个计算市场几十年的cpu,面临性能瓶颈的巨大挑战。于是,各种加速处理器,如gpu、dpu等,都在拼命地“挖cpu的墙角”。
作为cpu的霸主,intel肯定不会“坐以待毙”,一定会“奋起反击”。aia就是intel准备的“核弹”级的武器,aia是intel cpu的重要里程碑,其战略意图(可能)是:
捍卫cpu的核心地位,所有的一切加速器都需要围绕着cpu技术生态展开;
intel试图通过aia统一加速器接口、架构和生态。以gpu作为案例:一方面gpu是独立的架构和生态,与cpu架构是解耦的,可以基于x86架构,也可以迁移到arm或riscv架构;另一方面,gpu架构是各自封闭的,nvidia有自己的架构和生态,amd有自己的架构和生态。aia也许无法把所有的不同加速器类型都统一到一个标准的aia,但是把gpu统一一个,各种领域加速器dsa各统一一个,是完全可能并且技术上可行的。
一些常见的、关键的加速器,就自己搞定,集成到cpu中,比如sapphire rapids集成了数据流处理dsa(dsa可以把很多数据处理类的加速统一进来,如网络和存储等)和qat,未来再集成ai、网络、存储、虚拟化卸载、安全等基础设施层处理(也即dpu覆盖的范畴)功能或加速器,其可能性也是非常的高。
05 intel cpu的未来发展分析
cpu发展的几个重要里程碑:
里程碑0:cpu的出现。基于简单运算指令的通用处理器,实现软件和硬件的完全解耦。从此后,软件作为独立的工作领域而存在,软件开发人员不用关心硬件细节。
里程碑1:多核cpu,从串行计算走向并行计算。
里程碑2:vt-x和vt-d等cpu硬件虚拟化技术,实现无性能损耗的多租户多系统的独立运行;
里程碑3:aia技术的出现,通过aia,支持独立或集成加速器,并且规范加速器的接口/架构和生态。
sapphire rapids的出现,第一次从cpu的视角,试图统一各种加速器和cpu的控制和数据交互方式,也即加速器呈现给host cpu的架构。未来,aia的方式能否成功,大家拭目以待。
硬件加速,不管是独立或集成的加速引擎/芯片,都是可行的路径。但抛开具体的芯片实现,在架构上,硬件加速的形态会再往何处发展?这里我们抛砖引玉:
标准的交互(host cpu和加速器的接口或称为架构),统一加速器架构。可能无法把不同类型的加速器统一,但同类型的架构走向统一。
标准交互的同时,需要开放,需要跟cpu架构解耦,可以跨不同的cpu架构实现同样的交互协议;
基于标准的交互,基于一定的机制,要实现业务应用的跨处理器类型运行。
intel sapphire rapids,代表着cpu的一个重要的发展趋势是:cpu芯片不断融合各类加速器核,使得自己成为更加综合和均衡的新型处理器。
06 cpu、gpu、dpu,
从竞争/协同到混战/融合
目前,cpu、gpu和dpu,数据中心的三大芯片,从“井水不犯河水”,走向“跨越边界,侵入对方领地”的混战阶段。
cpu、gpu和dpu,既是协同的关系,又是竞争的关系。三者处于一个动态平衡的状态,在协同中竞争,在竞争中协同。这个趋势不断发展,走向更加深度地协同甚至融合。
从cpu单个处理器的“合”,走向众多加速器的“分”,再“从分到合”,逐步融合成一个新型的超级处理器。
!!!低价 IFR2023 IFR 2023 IFR2025
格力大松5G手机现已开售:2699元起
BAT的区块链战略方向分析
上新| 4Encoder Motor Module4通道编码电机驱动模块
降低移动电话非稳态噪声的九个步骤
Intel Sapphire Rapids CPU,吹响反攻DPU的号角
iphone8什么时候上市?iPhone8发布时间、真机、配置确定,价格分分钟破万,黄牛的狂欢
基于遗传算法的高频标签天线的优化设计
电动汽车为什么也要做风洞测试?
突破不确定性:生成式人工智能重塑管理
皓泽电子毛利率逐年下降,前五大客户营收占比超85%
不只是迭代,南卡新款骨传导耳机引领行业走上新巅峰
基于Halcon图像处理的太阳能硅片表面缺陷检测系统的总体设计方案
合理选择路由器,组建手机工作室网络
多点真诚少点套路,华为荣耀v9开卖以来,却让黄牛党赚了一笔
YELI环境监测信息管理平台使用手册
麒麟980参数曝光,华为 Mate 20首发,8月31日亮相IFA大会
蓝牙耳机平价推荐,高性价比蓝牙耳机推荐
利亚德、洲明、鸿利智汇等LED企业订单情况概览
盘点最值得买的智能家居产品,看你家里有没有