PCI标准的局限性及PCI Express系统的解决方案分析

基于isa(工业标准架构)总线的首个扩展卡最初在1978年问世,由于要求提升系统整体性能,mca(微通道架构)等总线系统或是扩展的isa总线随后也相继出现。鉴于数据通道宽度(主要是8或16位)和总线架构的速度问题,许多标准都限制了带宽。此外,万一错误配置了总线,很难确定差错在哪里,因此调试这个系统时就会遇到各种问题。根据这些旧的总线标准的经验,新的标准pci(外设部件互连)最终得以确定。本文将探讨pci标准的局限性,以及下一代pci express是如何以节约成本的方式得以实现的。
为了克服旧标准的上述局限,1992年人们建立了pci。其目的是构建一个更高带宽的标准,有即插即用功能和更稳健的协议。pci协议支持差错校验,通过与计算机的bios(基本输入输出系统)通信实现即插即用功能,并通过标准的控制/状态软件接口就地址范围或pci插卡功能等信息进行交换。如果出现地址范围重叠等差错,计算机本身可以提供一些反馈。一个基本的32位33mhz的pci系统,可支持的传输速率高达132mbps。但是,这个架构也有一些限制因素。总线是单向的(发起方和被请求的目标设备不能在同一时间进行通信),且几个卡要共享一条总线。如果一张卡正在传输数据,所有其他的可访问总线的部件必须等待。此外,在系统中无法处理pci带宽的低性能卡将进行“重试”请求,以确保有更多时间来处理数据。这就大大降低了整个系统的带宽。pci的另一个限制是各种应用对所需求带宽不断增加,特别是在视频、通信和总线领域。图1列出的一些应用,已经接近或超过了理论上的pci带宽132mbps。
图1:各种应用的带宽需求对比理论上pci提供的132mbps。
pci还有其他一些缺点,如限制只能有5个部件访问总线。由于pci总线特殊的无端接总线的反射,电路板的设计也更加困难。数据路径宽度为32或64位的并行线也对时序有苛刻的要求。
根据以往经验,pci-sig(pci特别兴趣小组)与行业内的领先公司合作,定义了pci的下一代标准。新标准最初被称为3g io(第三代输入输出),后来改名为大家熟悉的pci express。pci express的首个规范于2002年4月公布,其解决了原有pci标准的所有限制因素。为了克服无端接的大量并行总线并增加带宽,pci express转变为运行速率2.5gbps的串行链路,提供两个方向同时进行的2gbps的原始数据率。为了满足更高的带宽要求,规范允许使用几个并行的“通道”。因此对于目前计算机的低带宽应用,有很多x1和x4通道;对于有高带宽的要求,例如显卡,则有x16的插槽。
由于pci express规范使用基于层的协议,类似于osi的层次模型,它很容易改变物理层和保留上层协议。这种做法已被最近发布的pci express 2.0规范所采纳,使得链路速度高达5gbps。然而,大多数新的设计开始仍然是基于pci express 1.1版本的2.5gbps。
一个pci express系统可以用几个部件组成。所有的系统都需要有一个根联合体(root complex)对整个系统进行管理。交换设备(switch)是用来将几个卡连接到另一个pci express链路,“端设备”则代表了用户应用。桥接是端设备的特殊形式,可以将旧的pci应用连接至pci express总线。fpga主要用于端设备或桥接应用。
在pci express应用中fpga起着重要的作用,主要有三种设计方法:
*pci-express至pci桥和fpga
*外部的pci-express phy和fpga
*pci-express的phy集成在fpga之中
第一种使用pci-express至pci桥的方法,优点是可以重用旧的pci设计,但由于额外的桥接单元,成本很高。在桥和fpga之间,这个应用仍然被pci的缺点所限制,在成本方面处于不利地位。
图2a和2b
当仅需纯粹的pci express接口,而不需要其它逻辑时,外部的pci express phy和fpga(图2a)相结合可能极具吸引力。利用被称为pipe的并行接口,pci express phy可以连接到fpga。虽然pipe接口被认为是一个标准,但不同厂商在实现方面有着细微的差别,因此物理层芯片就不容易互换。此外,工业级的外部pci express phy芯片也不太容易买到,要不就是价格昂贵。此外,许多应用程序使用领先的器件,可用的领先的pci express phy芯片也是很有限的。
因此,如果只有一个pci express接口链路,而且在fpga中只要少量的额外逻辑(除了温度范围的限制,以及可用的领先器件),这种做法颇有意义。对于所有其他应用,最好是考虑一个整合的解决方案,如图2b所示。
如果采用整合的解决方案,首个挑战是寻找一个低成本的器件。在过去,pci express需要的串行链路一般只在高端昂贵的fpga中才有。然而,今天许多应用需要较低成本的解决方案。中档latticeecp2m,或最近推出的latticeecp3 fpga系列,拥有适合这种应用的一些功能。这两种器件都集成了可用于实现pci express x1或x4的串行通道。除了低成本优势外,与高端fpga解决方案相比,这两类器件的功耗也非常低。该“节能方案”使系统工程师能够降低功耗,因此只需要使用较小供电电源。图3展示了近期推出的ecp3 fpga系列的结构图。
图3:latticeecp3中档fpga框图,内有集成的serdes模块。
利用这些fpga的另一个优点是它们能够处理pci express使用的扩频时钟。许多其他的“单芯片”解决方案推荐使用外部的pll和去除抖动来处理时钟,这意味着电路板上会有两到三个额外的器件。这些器件也可用在工业温度范围。
既然这些fpga的串行链路只能实现物理层的serdes部分,所以需要额外的逻辑来实现完整的pcs。这由软ip核来完成,它可以配置成x1或x4 pci express端点。莱迪思的isplever设计软件包括一个称为ipexpress的工具,通过gui来配置功能,如pll、存储器等,还有软ip。pci express核可从莱迪思网站上下载,使用ip express进行配置并产生编程文件。即使没有有效许可证,也可以运行这个应用数小时,从而获得一个全面的系统*估。
为了符合系统的需要,配置pci express核的某些功能是非常重要的。例如, pci express提供不同的有效载荷大小。有效载荷的规模越大,核中需要的fifo也越大。为了节约资源,可以通过ipexpress来选择针对pci express核的正确有效载荷的大小。还有一些应加以调整的其他参数,以针对系统要求优化fpga的利用率。
在许多项目开发中,只有在开发后期才能得到样机电路板。为了熟悉pci express的协议,可从莱迪思获取pci express设计套件。该套件包含了电路板,可用于x1或x4的插槽,并有一些演示配置:
* 基本方法
o 用户访问内存和寄存器
o 在电脑上运行演示与在电路板上的pcie ip核之间提供简单的互动
* 吞吐量
o 在pcie核和serdes之间演示和测量带宽性能
* scatter gather dma
o 使用dma在pc机内存和pci express卡之间传送数据
设计人员可以选择使用其中一个准备好的编程文件,在30分钟内构建一个完整的演示。套件不仅提供了硬件设计文件,而且还提供驱动程序和运行在pc上的应用程序,这样就为设计人员的应用提供了一个良好的起点。图4展示了莱迪思的一个完整的pci express演示设计。
图4:lattice pci express的演示。
用协议分析仪和示波器可以调试系统。但是,利用功能或者rtl级仿真时,设计人员已经可以找到许多问题。
系统调试的三个主要方法:
* 串行环回
* 激励发生器和测试器
* 总线功能模型
莱迪思的pci express核包含一个简单的采用串行环回的测试平台。借助一些来自测试平台的互动建立pci express链路,并发送一些数据包。这是仿真设计的非常基本的方法。
一个更先进的方法是使用激励发生器和测试器。fpga中串行链路的仿真模型被一个模型所取代,后者生成数据包,并检查fpga内的逻辑响应。
最全面且成本昂贵的方法是建立总线功能模型。有几个供应商提供pci express的仿真模型。根据总线功能模型,设计人员可以测试应用程序,以及fpga的串行链路与整个系统的互动。

蓝牙耳机买什么品牌好一些,高性价比蓝牙耳机推荐
我国制造业转型升级,为什么要推动制造业与服务业的融合
语音控制视为人机接口进步项 语音激活可嵌入到任何地方
雷军宣布前联想集团副总裁常程加入小米 将担任小米集团副总裁职位
浅谈网络安全顶层设计、机制体制改革
PCI标准的局限性及PCI Express系统的解决方案分析
拉压力传感器怎么使用_拉压力传感器使用原理
华为云大数据BI解决方案,助力企业数字化运营
远航汽车全明星阵容亮相粤港澳大湾区车展 展示中式豪车风采
中科蓝讯上市首日破发,开盘跌27.69%!三年卖出超过19亿颗芯片,市值近80亿
机器人视觉存在的问题及研究方向
电容上的cbb是什么意思?你想知道吗?
无人机推动海战变革的原因是什么
大众汽车宣布于2019年第二季度推出共享电动汽车
MX2201B二合一集成MOS管锂电池保护IC
土壤水势测定仪研究掌握土壤的水势变化情况
区块链将可怎样改变供应链
2019年植保无人机的发展期望
兆驰股份LED外延芯片项目2019年实现满产
微软2024年首个补丁周二修复49项安全漏洞,其中2项为严重级别