基于ADSP-TS201与FPGA的信号处理系统实现及优化设计

现代雷达信号处理已成为雷达功能实现的关键，本文根据某型雷达信号处理机的系统需要，对其硬件结构及软件设计做了系统优化。设计了1套以4片 ts201和1片fpga为核心信号处理板，该系统仅用l副板卡即实现空时二维信号处理。实现了自适应副瓣相消，4路脉冲压缩与mti／mtd，副瓣匿影和差波束测角等算法，可以完成对目标距离，方位偏差量的测算，满足系统需求。
1 系统组成分析回波信号在天线上进行部分微波合成，形成和、差通道信号及两路辅助天线信号，进行iq正交插值，1／8抽取后，形成4路待测数据，数据率共为128 mb／s。系统算法结构，如图1所示，主要由旁瓣相消模块，数字脉压模块，mtd处理模块由3部分组成。和路信号mtd（fft-cfar）后经副瓣匿影若判定有目标则再由和、差两路数据计算方位偏差量。
以雷达工作的低重频模式为例，iq数据为5 388点，重频为140 hz，考虑到一定的时间余量，4路信号的传输及处理必须在《6．7 ms的时间内完成。因此系统的数据速率、数据量及运算规模决定了系统设计必须具有以下特点：
（1）具有高性能浮点处理芯片，可完成旁瓣相消、脉冲压缩、相参积累、杂波图、恒虚警处理。
（2）内部各处理芯片间可进行高速数据传递且可外部扩展存储芯片，保存大量数据。
（3）具备对外的数据接口和控制接口，并可输出故障检测信号。
（4）软件设计中必须进行大量优化，保证上述所有处理模块在1个脉冲周期内完成。
2 雷达处理机实现 2．1 硬件平台设计
系统运算量及时间要求，信号处理板需采用多dsp并行处理的结构，为达到高速浮点处理能力、高数据吞吐率及大内存空间的要求，dsp芯片选用 adsp-ts201，它是adi公司最新型号的tigersharc架构高性能浮点数字信号处理器。它具有最高达600 mhz的工作时钟，且每周期可完成4条指令；包括双独立运算模块及用于地址计算的双独立整型alu，可完全并行操作；拥有24 mb／s的片内存储器，内存容量大；此外还有14路dma控制器及外部端口、4个链路口，可进行高速数据吞吐；拥有4个sdram控制器，可外部扩展存储芯片；拥有4个可编程flag引脚，可对外输出所需标志信号。
多dsp设计通常有共享总线方式和链路口耦合方式两种结构。共享总线结构的优点是可以提供全局地址空间，把多dsp的地址空间映射到主机的内存空间进行统一访问。任一dsp也可通过总线读写其它处理器内存，操作方便。然而，当多dsp间数据交换频繁时，总线竞争往往造成数据通信的总线瓶颈，因而该方法有明显的缺点。采用链路口耦合方式则具有明显的优点，各dsp总线独立，拥有完全独立的内存空间，各dsp程序设计可完全独立，减小了程序调试的难度。各dsp之间仅通过链路口无缝连接，片间连线少，降低了pcb布线难度和层数，节约了制板成本。此外，数据传输采用链路口的dma方式并不占用dsp内核的运算时间，可以提高处理板的实时性能。因而采用将4片adsp-ts201通过链路口两两互连，形成松耦合的多dsp结构，如图2所示。各dsp通过链路口可在任意两个dsp之间进行最高达500 mb／s的数据传输。
板卡主要以4片ts201与1片fpga为核心，外加flash，sdram与光纤及其配置芯片协同完成数据存储及传输。fpga主要完成系统中与雷达匹配的时序控制，对板外的数据传输与对dsp的总线通信。fpga通过两套独立的32位外部数据总线与dsp0和dsp1连接，采用流水协议，外部总线工作频率为50 mhz，可以实现400 mb／s的数据传输速度，达到了系统可进行高速数据传输的要求。系统时钟为50 mhz，ts201经12倍频工作在600 mhz，单板卡的系统峰值处理能力可以达到14．4 gflops，板卡运算速度满足了系统需求。
2．2 系统软件设计及优化
系统算法的复杂性与计算中的动态范围的要求，系统算法在dsp中软件化设计，调试方便。回波经微波合成后形成和、差路及两路辅助通道信号，a／d采样正交差值后形成4路数据经光纤传入fpga，dsp0经总线以dma方式接收4路数据，并分发至其它3片dsp。各dsp单独处理一路数据，如图2所示，mtd后回传至dsp1进行副瓣匿影及门限检测，并估算目标方位偏差量，检测结果由dsp1经总线以dma方式返还至fpga，所有的模块限制在1个脉冲周期内完成，形成了图3的软件流程图。
（1）数字脉冲压缩。
系统中采用频域方法实现脉冲压缩。其基本原理是先对回波信号做fft得其频谱s（ω），将s（ω）与匹配滤波器频谱h（ω）频域点乘，最后对乘积结果做ifft即得脉压结果y（n），整个过程由两次fft，一组频域点乘，及一次ifft运算组成，由下式表示
y（n）=ifft{fft［s（n）］*fft［h（n）］} （1）
1）针对ts201芯片内存量大的特点，将h（ω）直接存入dsp内存，以h（ω）所需内存换取了一次fft执行时间。2）脉冲压缩结果是否乘以n 对后续处理无实质影响。故ifft的实现省略了除以n的操作，在此基础上dsp中可由两种方法实现：一种是通过改变旋转因子中正弦项的符号，调用fft函数实现，运算速度与fft完全一致，但保存新的旋转因子多耗费了一倍内存；另外一种则为实虚交换后做fft，再实虚交换即实现iff-t，该方法优点是不占用新的内存。这里在dsp程序中对第二种方法稍加改进可使处理时间与fft完全一致：在频域点乘中结果输出时完成第一次实虚反序不占用额外指令，稍后中可看出在mtd模块中稍加改动可使脉压输出的实虚顺序并不引起系统指令的增加。原脉冲压缩处理时间为：经改进后处理时间可缩短为。内核时钟工作在600 mhz时，1 024，4 096，8 192点的频域脉压时间42．24μs、272．63μs、632．1μs，远小于脉冲重复后期，保证了系统功能的实现。
（2）mtd模块实现。
相参积累技术进一步提高了系统信噪比，使雷达在各种杂波背景下的目标检测能力提高。mtd模块用16点fft实现，由于设计中脉冲压缩输出为先虚后实，故需对时域抽取的16点fft第一级蝶形运算稍作修改，使对保存+j寄存器的操作与对保存re寄存器的操作互换，执行时间可与原16点fft完全一致。
dsp1还需处理杂波图，正常视频检测，测角等，内存消耗大，因此占用部分sdram空间辅助存放了8周期的脉压结果，数据传输量为5388 ×2×8=86 208，数据量较大，因此mtd模块的主要实现难点是数据传输时间问题。
mtd是对同一距离单元上的脉压数据进行处理，因此要求在dma传输的过程中实现矩阵行列转置，8个脉冲周期的数据量已经超出了普通一维dma传输方式的上限，且若在sdram中跳址传输，遭遇频繁的跨页寻址时会耗费更多时间。采用二维dma传输方式，通过改变tcb配置使dma传输在sdram中连续寻址，而在dsp端接收地址自动跳变，在矩阵传输的同时实现行列转置。系统时钟为50 mhz，传输时间为86 208／50=1．73 ms，dma传输方式无需消耗内核时钟，占用总线时间仅为1．73 ms，满足了传输时间的要求。
经mtd后和路信号经副瓣匿影及门限检测后判定有目标，则差路信号在相同距离门上按滤波器号选取对应多普勒通道的处理结果，按式（2）查找误差曲线完成和差波束测角
式中，y△为差路信号数据；y∑为和路信号数据；k为一常数；ε为所求方位误差角。回波的脉压结果，正常视频输出，mtd检测结果，目标方位角误差角均按距离波门顺序由fpga返还至伺服系统，控制相控阵天线调整波束指向对准目标。
3 结束语本文以4片adsp-ts201与1片fpga为核心实现了信号处理系统。该系统对硬件结构和程序流程进行了优化设计，单板卡完成了信号处理，系统硬件结构简单、程序易调试、整体可靠性高，对处理机的系统更新具有现实意义。

英伟达推出超级计算机DGX GH200
5G+工业互联网的数字孪生钢管生产集成技术研究
摩托罗拉BB机拆解：经典电路再现
实现高速ADC采样与数据远端存储、本地存储解决方案
小马智行计划为商用自动驾驶出租车项目研发和测试车队维护解决方案
基于ADSP-TS201与FPGA的信号处理系统实现及优化设计
PIC单片机驱动LCD段驱动器的设计
如何使用示波器解决I2C通信开发中遇到的问题
Jeep智能全境界腕表评测可作为化繁为简的运动装备带来更无拘无束的运动感受
CES|艾睿电子推出首个采用ADI的3D飞行时间技术针对健康护理产品的概念验证设计
5G时代来临一下科技迎来无限发展机遇
大数据是如何改变我们的生活的
人工智能机器人的应用_人工智能机器人的好处和危害
新型玻璃芯片帮助克服光纤低损耗耦合的困难
信号发生器AFG1022两个通道没有输出维修——安泰泰克仪器维修
ArcBlock正在打造从协议层连接区块链的平台
泰克扩展了USB频谱分析仪家族系列，支持13 GHz和18 GHz频谱范围
人工智能助力下新经济呼唤市场监管进行新升级
基于光纤通信的汽车照明及信号控制系统设计
量产临近，自动驾驶测试验证“刚需凸显”