DPU特征结构系列(一)DPU是以数据为中心IO密集的专用处理器

从应用特征来看,可以把应用分为“io密集型”和“计算密集型”两类,如下图所示。io密集型应用,通常体现为较高的输入和输出带宽,数据直接来自于io,数据通常具备流式特征,数据局部性不显著,如果处理性能与带宽匹配,片上缓存的作用就可以弱化。例如处理路由转发、数据加密、压缩等。计算密集型应用,体现为较高的计算密度,通常浮点性能突出,数据来自主存,数据局部性显著,复用性高,主存的大小对于问题求解的性能有直接影响。例如求解线性代数方程组,大规模神经网络训练、推理等。
图 不同类型的处理器的特征结构
一个处理器芯片是“io密集”还是“计算密集”只部分决定了芯片的结构特征,并不能完全定义芯片的主体架构。无论是io密集,还是计算密集,即可以以通用cpu为核心构造主体计算架构,也可以以专用加速器为核心构造主体计算架构。前者可称之为以控制为中心(control-centric)的模式,后者称之为以数据为中心(data-centric)的模式。控制为中心的核心是实现“通用”,数据为中心的核心是通过定制化实现“高性能”。以应用特征和架构特征这两个维度粗略划分处理器芯片类型分布,如图2-1所示。
通用cpu是偏向于控制为中心结构,理论上看就是要“图灵完备”,要支持完备的指令集,通过编程指令序列来定义计算任务,通过执行指令序列来完成计算任务,因此具备极其灵活的编程支持,可以任意定义计算的逻辑实现“通用”——这也是cpu最大的优势。同时,为了提高编程的开发效率,降低编译器复杂度,缓存管理和细粒度并行度的开发通常都是由硬件来完成。类似的,还有大量的用于各种嵌入式、移动设备的微控制器mcu,并不强调高带宽,也是以控制为中心的结构。np,dsp也是便向于基于通用处理器来做专用化扩展,但是非常注重高通量的性能属性。例如,np要支持数tbps的转发带宽,所以大体可以视为控制为中心、但是io密集的处理器类型。
gpu是以数据为中心的结构,形式上更倾向于专用加速器。gpu的结构称之为数据并行(data-parallel)结构,优化指令并行度并不是提升性能的重点,通过大规模同构核进行细粒度并行来消化大的数据带宽才是重点。例如,最新的nvidia titan rtx gpu有4608个cuda核、576个tensor核,而且单片gpu通常配置数十gb的超大显存。同时缓存管理多采用软件显示管理,降低硬件复杂度。这类超众核结构是以数据为中心、执行计算密集型任务的代表性架构。
dpu也偏向于数据为中心的结构,形式上集成了更多类别的专用加速器,牺牲一定的指令灵活性以获得更极致的性能。但是与gpu不同,dpu要应对更多的网络io,既包括外部以太网,也包括内部虚拟io,所以dpu所面临的数据并行更多可能是数据包并行,而不是图像中的像素、像块级并行。而且dpu也会配置少数通用核(如arm,mips)来处理一定的控制面的任务,运行轻量级操作系统来管理dpu上的众多的异构核资源,所以体现了一定“通用”性,但性能优势主要不源于这些通用核,而是大量专用计算核。早期的一些网络处理器采用过类似tile64的通用众核结构,以增加核的数量来应对多路处理的数据,实现并发处理,但单路延迟性能通常都比较差。因此,dpu更偏向于以数据为中心,执行io密集任务。
dpu是软件定义的技术路线下的重要产物。在软件定义网络中,将数据面与控制面分离是最核心的思想。dpu被定义为强化了数据面性能的专用处理器,配合控制面的cpu,可以实现性能与通用性的更佳的平衡。
来源:专用数据处理器(dpu)技术白皮书,中国科学院计算技术研究所,鄢贵海等

耐湿型X2安规电容有什么特点?其作用有哪些呢?
激光雷达正开始打入ADAS市场
gradle的安装和配置
泵房无人值守系统解决方案的控制方式
ups电池几年换一次比较好
DPU特征结构系列(一)DPU是以数据为中心IO密集的专用处理器
一款新型霍尔板在推杆电机上的运用
达孚电子为你详细介绍交流陶瓷安规电容器
国芯思辰|漏电检测芯片CN54123可兼容M54123L用于漏电保护器
微波射频电路杂波干扰问题技术分析及改进研究
物联网怎样去实现环境可持续发展
2018年上半年内存的价格将继续上涨
iPhone8什么时候上市?iPhone8最新消息:iPhone8即将上市机型已开卖,iPhone8功能无线充电+IP68+3D感应
恩智浦与日立能源合作开发电源模块,加快碳化硅在电动交通领域的采用
为什么OLED电视在短期内很难取代LCD电视?
汽车ABS到底是干什么用的
用Python实现3D地图教程
魅族首款双摄手机是它 砍腰圆键回归小圆点?
外骨骼辅助双足行走机器人:带轮子也可以上楼梯
交换机安全设置功能
s