摘要:本文提出了一种计算方法简单、计算量小、所需存储量小的近场聚焦多波束形成的高速fpga实现方法,用于成像声纳中高精度、高覆盖、高波束数的多波束形成。本方法基于180阵元均匀半圆阵,通过阵元等效弦的转动,仅采用6组加权系数矢量即可在90°范围内产生540个波束,使存储量降低了两个数量级,从而有效降低对硬件存储资源的要求。该系统工作在270mhz,通过乒乓操作实现数据不间断的输入输出,从而提高速度;通过多通道多系数复用乘法器和流水并行技术,仅采用24个乘法器完成了540个波束的实时产生,实现了8190倍复用。与传统并行处理架构相比,该方法提高了系统稳定性和速度,并大大节约了fpga硬件资源。
引言
由于成像系统具有通道数多、数据量大、计算复杂、实时成像的特点[1][2],因此要求处理器在保证声纳的灵敏度的前提下具有高速、高精度、大存储量和实时处理的能力[3]。与其他cpu、dsp处理器相比,fpga具有无法比拟的系统级的用户可编程特性以及强大的并行计算能力,适用于高速、高密度的高端数字逻辑电路设计。此外,fpga具有非常高性能的i/o带宽。大量的i/o引脚和多块存储器可让系统在设计中获得优越的并行处理性能,适用于具有180通道信号输入的成像声纳系统。利用fpga可以实现成像声纳的实时信号处理[4-6]。
因为需要在fpga中存储大量的波束加权数据,所以芯片内部block ram的数量是选择芯片的一个重要因素。对工作速度和芯片本身的各种资源、成本等方面进行权衡,选择virtex-6系列的vc6vlx130t来实现本系统。
1 近场聚焦多波束形成
成像声纳往往工作在近场,在近场范围内,声波近似为球面波,指向性是距离的函数,所以必须作近场聚焦进行校正[7-11]。本文采用所有波束都聚焦的方法,提前计算好聚焦在不同距离的补偿相位并存储在存储器中,以供波束形成时调用。
图1 近场聚集多波束形成示意图
根据系统需要,焦面位置可以有多个,焦面位置的多少并不影响运算速度,只是消耗的rom资源稍多。为了降低存储需求,应在不降低性能的条件下尽可能减少聚焦面个数。本文中,在允许主瓣方向有0.001°误差、旁瓣电平小于-14db和主瓣宽度不大于1°的情况下需要7个聚焦面就能完成近场(r<18m)范围的波束形成,聚焦距离从1米到18米(1米以内为盲区,不考虑),焦面之间的距离不是均匀的,而是随着声源距离的增加而增加。
图2 聚集波束形成的1#波束方向图
以基阵所处位置为圆心,目标所处位置用(距离,方位)来表示。假设声源位于(1m,45°),选取不同聚焦面对波束形成的影响如图5所示,其中蓝线为理想情况下,采用与实际所处位置相同的聚焦距离(1.1m)进行聚焦时的1#波束方向图,其波束指向为45°,主瓣宽度为0.9010°,旁瓣电平为-14.47db。红线为声纳系统实际工作情况下,按照上述8个聚焦面对实际距离进行近似选取,采用1.05m聚焦时的1#波束方向图。两种情况下的波束方向图吻合得很好,因此虽然只取了7个聚焦面做近场波束形成,但对波束形成的效果影响不大,却可以大大提高系统资源的利用效率。
2 多波束形成的fpga 实现
因为数字多波束形成需要处理大量数据,且对处理速度有很高的要求,但计算结构相对简单,很适合利用fpga实现多通道并行处理,同时兼顾速度和灵活性。
数字多波束形成(dbf)主要完成复数乘法和复数加法运算,每路输入信号为经过下变频后输出的基带i/q 分量。采用91个阵元的单波束dbf要完成实数的364个乘法和363个加法运算,而在fpga里影响计算速度和资源消耗的主要是乘法器。若仅采用并行处理方法,产生540个波束需要540×91×4=196560个乘法器,需要消耗大量的乘法器资源,在一片fpga上实现不了。另一方面,单通道数据输入波束形成器的速度为30khz,而fpga的芯片处理速度通常可达几百兆,因此可以利用fpga的高速性能,充分利用乘法器资源,通过时分复用乘法器(tdm)实现多通道数据多系数乘法运算。采用90个波束91个系数共用一个乘法器,实现8190倍复用,产生540个波束所需乘法器的数量减少到24,如表1所示。
表1 资源利用率与速度关系
数字多波束形成分为6个模块,每个模块采用同一组加权系数产生90个波束,如图3所示:
图3 dbf整体功能框图
beam1-beam6模块功能相同,唯一的区别是输入加权矢量数据不同,因此以beam1模块为例说明其fpga实现过程。基于fpga 的多波束形成器由存储模块、控制模块、乘法累加模块等几部分实现,系统的组成结构框图如图4所示。
图4 波束形成fpga实现功能模块
2.1 存储模块
前端处理后的数据采用乒乓操作实现数据不间断的写入和输出,实部数据和虚部数据使用独立的双端口ram存储,如图4中所示实部ram1和虚部ram2。因为需要缓冲的数据为180通道上的16 bit数据, 所以乒乓ram 的容量应为所需要缓冲数据的2倍,即16×180×2×2 =11.25 kbit。
乒乓ram的读顺序比较特殊:为了加速和节约乘法器资源,用4个实数乘法器来实现90个波束91个系数的复用,所以读时钟是写时钟的90×91/180=45.5倍。读顺序如下:读取0-99地址单元的信号数据用于产生1#波束,然后读取1-100地址单元的信号数据用于产生7#波束,…,读取88-187地址单元的信号数据用于产生529#波束,最后读取89-188地址单元的信号数据用于产生535#波束。读完这些数据之后正好下一时刻的信号数据已写入180-359地址单元,此时在上述读地址的基础上加180后,读取数据用于产生下一时刻的540个波束数据,依次循环往复。
片内rom存储波束加权系数矢量,6个波束形成模块使用各自的系数rom。其读时钟与乒乓ram相同,读地址相对比较简单,重复地址0-90,根据数据点位置 确定该调用哪个聚焦面的加权系数矢量。
2.2 控制模块
控制模块产生读写地址信号和控制信号,对乒乓ram和系数rom的读写地址的控制按照上文所述内容设计;控制信号部分主要是产生控制运算部分和存储部分的运行使能控制信号。
2.3 运算模块
信号数据与对应的加权数据读取出之后以270m的速率串行进入乘法累加模块。其中复数相乘是其中最重要的运算操作。假设第 接收通道的信号表示为:
首先,1-91通道的数据串行进入乘法累加器,进行91次复乘和90次复加之后,得到一个包含实部和虚部的波束数据;之后,2-92通道的数据进入乘法累加器,得到第二个波束数据。如此,形成90个波束,只需要一个复数乘法器,即4个实数乘法器。
图5 乘法累加器ip核
乘法累加采用xilinx的ip核实现,如图5所示,其中各个参数的含义如表2所示。
表2 乘法累加ip核各参数含义
通过控制bypass信号来控制乘法累加过程:当滤波后数据和加权系数有效时,使bypass维持一个周期的高电平后变为低电平,计数100周期后再次变为高电平,开始下一个波束数据的计算,因此bypass的周期为1.35mhz。
图6 波束形成模块波形图
如图6所示,波束数据输出速率为2.7mhz,对应着单个波束输出速率为30khz,计算结果与matlab仿真结果一致。各个波束实部和虚部输出后,通过乘法运算得到波束的模平方。
3 验证结果
信号从基阵90°方向射向基元,1#基元至180#基元接收到信号,通过基元与波束点的延迟,得到各基元处的信号。180个基元的信号同时采集,一个周期采集4个点,采集到的数据作为标准信号源。系统设计时,将标准信号源数据存在信号处理单元。系统运行过程中,如果信号处理单元接收到使用标准信号源的命令,就读出标准信号源数据进行滤波抽取和多波束形成运算。将系统的波束输出结果与matlab仿真结果对比,可检测系统是否工作正常。
图7 chipscope验证标准信号源测试
图7所示为chipcsope采集到的采用标准信号源测试时某个时刻的540个波束的波束值,具有良好的指向性。
图8 标准信号源测试图像
图8所示为实际系统采用标准信号源测试,将波束数据通过千兆网上传至pc机得到的显示图像,为90°方向上的一条亮条纹。
图9 fpga资源利用率
本文提出的改进算法只需要6组加权系数矢量即可产生540个波束,有效降低了对存储资源的要求。通过乒乓操作实现了不间断的数据输入输出,以及流水并行处理,能够实现实时处理。通过多通道多系数复用技术,将乘法器资源使用量降低到24个,大大节省了fpga的硬件资源。数字多波束形成所使用的fpga资源如图9所示,其仅仅使用了整个芯片资源的一小部分,为成像声纳系统其余模块的实现提供了很大的空间。
结语
本文提出一种利用fpga实现高速多通道的多波束形成方法。通过乒乓操作、流水并行处理提高速度;通过多通道多系数复用乘法器和模块复用技术,仅采用24个乘法器完成180通道数据的540个波束实时产生,有效降低了fpga资源利用量,适用于工程上实现多波束形成系统。
未来我们将看到更多智能、更高效的家庭自动化设备
Google在人工智能和计算机领域的最新进展
照明创新技术将会持续融入新型智慧城市建设中
3D打印抛光神器Polysher:令打印件表面光滑如镜
CUDA编程接口介绍
成像声纳中多波束形成的FPGA工程实现
魅族16s Plus真机照曝光手机屏占比接近了设计的极限
LED光树搭建图解
智汇云全屋智能家居核心设备接入华为智慧生活
iPhone 8P大降价后实现反超,超越华为小米占第一
IIoT时代,工业自动化市场呈现哪些变化?
温度变送器与plc接线
磷酸铁锂产业投资热中冷思考
苹果宣布召回香港、新加坡和英国市场的电源适配器,或致用户触电
LabVIEW与USB的数据通信方案实现
NCSU使用AWR软件进行低噪声放大器和X波段功率放大器设计
MARVEL R获中国5G终端进网许可证,加速迈进5G智慧出行时代
赛灵思Versal自适应计算加速平台助于高效实现设计目标
实现LED路灯网络的智能监控
认识RISC-V可信执行环境(TEE):Risc-V Keystone