基于Zynq的图形生成电路的软硬件设计

摘要:为了适应机载液晶显示器向低功耗、高集成度发展的趋势,提出了一种基于zynq可扩展处理平台的图形生成电路实现方法.该方法以zynq为核心搭建硬件平台,使用zynq集成的arm 处理器执行图形生成算法运算,配合可编程逻辑资源,按照一种三缓冲机制对ddr3sdram 帧存数据进行缓冲处理,实现图形的实时生成.采用本设计可以生成多种分辨率的机载图形画面.实验结果表明,当生成分辨率为1024×768的efis电子飞行显示系统画面时,帧率可达74fps,能够满足机载液晶显示器高性能实时显示需求。
1 引言 在飞机座舱显示系统中图形显示占据重要地位[1].主显示器尺寸不断加大,分辨率不断提高,并日益朝着大屏幕化、综合化、信息化和智能化方向发展[2].随着分辨率的提高,要显示的信息量也大幅增加,座舱图形综合显示系统是一个对实时性要求很高的系统[3],军用飞机在做战术动作时,画面变换速度快,要求图形的更新速度也必须很快,至少要比帧或场的刷新速度快,才可以避免画面的断续[4g5].采用dsp+fpga 的图形硬件加速架构,或者使用专用gpu 图形生成芯片,都可以生成高分辨的机载显示器图形,但随之而来的是产品成本的急剧增加以及功耗的不断上升[6].为机载图形显示系统配置更合理的硬件设计和软件架构变得尤为迫切。
xilinx最新平台zynq将处理器的软件可编程能力与fpga 的硬件可编程能力实现完美结合,以低功耗和低成本等系统优势实现良好的系统性能、灵活性和可扩展性[7].本文提出一种基于zynq可扩展处理平台的实时图形生成电路,利用zynq内部集成的arm 处理器以及可编程逻辑资源,实现了机载显示器图形画面的实时生成与显示。
2 zynq简介 2.1 zynq构成 zynq构架将内部结构分为处理器系统(processingsystem,ps)与可编程逻辑(programmablelogic,pl)两部分[8].ps部分包括双arm cortexga9内核、存储器接口以及通用外设接口等资源.pl部分也即常规的fpga,通过pl生成的ip核可以作为arm 内核的扩展外围设备或者arm 内核的加速部件.zynq器件内部结构图如图1所示。
图1 zynq内部结构图
zynq架构可以对pl和ps中运行的自定义逻辑和软件方便地进行管理和规划,ps和pl的单芯片综合使其在i/o 数据带宽、功能耦合、功耗预算等方面的性能表现大大超越了以往assp和fpga 双芯片解决方案。
ps和pl可以通过多种途径实现互联,包括gpio端口、axi总线端口、emio 端口、中断、dma 等等.其中axi总线是arm 系统中连接各个模块的主要通道,各个功能部件通过axi总线实现互联.在pl中可以通过工具自动生成带有axi接口的ip 核,和ps 端进行高速数据交互。
2.2 ddr memory控制器 zynq内部集成的ddr memory控制器支持ddr2、ddr3、lpddr2等多种存储器类型,包含了3个主要模块:axi存储器端接口ddri、带有传输调度机制的中央控制器ddrc 和物理层控制器ddrp[9].ddrmemory控制器框图如图2所示。
图2 ddr memory控制器框图
ddri端口符合axi总线标准,包含4个64位的同步axi接口,分别为s0、s1、s2、s3,用于接收多个axi主端的访问请求,其中s0和s1端口接收ps部分cpu 的访问请求;s2和s3端口接收pl部分逻辑端的访问请求.ddrc对来自多个axi主端的访问请求按照其调度策略进行裁决,裁决实施的依据是主控端访问的优先级、等待时长计数器和紧急信号.ddrp 处理来自于ddrc的读写请求,并将其转换成符合ddr 存储器时序要求的特定信号。
2.3 axi vdma axi vdma 是xilinx公司开发的一个软核ip,用于在系统存储器和支持axi4-stream 视频类型的目标ip之间提供一个高速的数据存取通道[10].axi4-stream 格式数据流不能直接用于驱动显示,还需要将数据流以视频使能信号为界进行分割,配合行场同步信号驱动视频终端显示。
该ip 有两路axi4-stream 接口,分别为axi memory map to stream (mm2s)stream master 和axi4-stream to memory map(s2mm)stream slave,其中mm2s为主端口,用于输出转换成axi4-stream 格式视频流的系统存储器中数据.s2mm 为从端口,用于接收axi4-stream 格式视频流转换成存储器数据.mm2s和s2mm 彼此相互独立,可以并行同时工作.ps端的处理器可通过axi4-lite总线对其内部的寄存器进行访问以控制vdma 工作模式、获取vdma 工作状态。
3 设计实现 3.1 硬件设计 3.1.1 硬件架构 本文通过zynq完成图形生成与显示功能,原理框图如图3所示,硬件模块主要包括zynq、ddr3sdram、flash、双口ram 等.正常工作时ps中的arm 内核根据从双口ram 中接收到的绘图指令和参数完成绘图算法,将图形数据写入ddr3sdram 存储器中.pl 从ddr3中读出图形数据进行显示,并对ddr3sdram中的图形数据进行清屏处理。
图3 zynq图形生成原理框图
3.1.2 zynq硬件平台设计 本文通过xilinx 的ise14.2 软件集成的xps开发环境完成zynq图形生成电路的硬件平台设计.利用xps可以快速地对zynq系统内的各种硬件资源进行定制设计,包括存储器、外设、arm 处理器、系统ip和用户ip等.zynq硬件平台结构图见图4所示.
图4 zynq硬件结构图
本文在zynq中的pl 部分应用了vdma、axi2xsvi、xsvi2axi、vtc等几个ip核,其中vdma 用于从ddr3sdram 中读出图形数据,同时向ddr3sdram 中写入全零数据以达到清屏目的.axi2xsvi用于将axigstream 数据流用行、场同步信号进行区隔,供外部显示模块进行显示.xsvi2axi用于将带有行场同步信号的视频数据转换成axigstream 数据流.vtc 用于生成系统运行所需时序信号.对vtc根据显示时序进行修改,系统即可产生多种分辨率图形画面。
3.1.3 图形缓冲设计 本文中对ddr3sdram 帧存的操作包括3种类型:ps写入、pl读取、pl清零.清零从本质上说也是一种写入操作,写入的是全零数据.读取和写入请求通过ddr 控制器中的调度机制和仲裁策略分别在不同时刻得以响应,得益于ddr3sdram 的高速高带宽优势,外部可以同时进行多个通道的读写操作.针对本文中ddr3sdram 的3种操作类型,在ddr3帧存中设置了3个缓冲区,分别为buffer0,buffer1,buffer2,相应地,vdma 中的framebuffer数目也设置为3.buffer的切换机制如表1所示.
这种三缓冲切换机制保证了写入的都是已清零完成的buffer,清零的都是已读出完成的buffer,读出的都是已写入完成的buffer。
根据buffer切换机制,vdma 中的s2mm和mm2s通道分别以指定的buffer为操作对象.初始化状态下为每个buffer指定默认的操作模式,而后在每个帧周期内启动vdma 切换buffer操作模式,从而不间断地输出图形数据。
3.2 软件设计 3.2.1 zynq系统软件 系统绘图时,根据双口ram 提供的画面内容要求,启动绘图任务,并将绘图结果保存下来.显示工作完全由pl内部的显示逻辑负责,显示逻辑从显存中读取显示数据,按照标准时序送至显示接口.图形软件的接口关系如图5所示.
图5 图形生成软件接口示意图
3.2.2 画面显示软件 画面显示软件主要包括初始化模块和主模块,结构如图6所示.初始化模块完成arm 内核启动;外设初始化信息加载;ddr3sdram、uart等设备初始化;vdma 寄存器配置等初始化工作.运算控制模块由双口ram 读写模块;ps、pl 通信模块以及绘图模块3部分组成,其中双口ram 读写模块主要负责从双口ram中读取绘图指令数据,为绘图模块提供必要的绘图参数;ps、pl通信模块负责arm 内核与vdma的通信,切换缓存;绘图模块完成分配的绘图任务,并将相应的计算结果,也即对应的像素点信息写入ddr3sdram 中。
图6 图形生成软件结构图
4 实验与对比 4.1 实验过程 在实验验证阶段,分别采用自主开发的zynq图形生成模块和dsp图形生成模块作为实验和比较对象.其中,zynq 图形生成模块采用的zynq器件型号为xc7z020,集成的arm 处理器频率为667mhz,采用的ddr3sdram 器件型号为micro公司的mt41j128m16,时钟频率设置为533mhz.dsp图形生成模块采用的dsp器件型号为ad 公司tigersharc 系列的ts201,主频设置为520mhz。
为了全面验证zynq平台的图形生成性能,本文针对几种常规分辨率机载显示器,对两种平台的图形生成时间和帧率分别进行对比测试.机载显示器常规分辨率有640×480、600×600、1024×768等几种,每种分辨率下具体图形生成时间和帧率与图形内容和复杂度有关,本文选取常用的典型图形作为测试对象,每幅图形均包含了直线、圆弧、矩形、字符、数字、符号等内容,如图7所示。
图7 测试图形
以1024×768 分辨率的efis 画面为例,zynq平台实时生成图形数据并送至外部监视器显示的示意图如图8所示.
图8 zynq平台1024×768分辨率图形生成示例
4.2 实验结果 针对3种分辨率典型图形画面,zynq平台和dsp平台图形生成时间和帧率对比分别如图9和图10所示.
图9 图形生成时间对比
图10 图形生成帧率对比
图形生成时间包括图形算法运算时间和图形数据写帧存时间.在进行图形运算处理时,针对zynq平台的特点采取了一系列的优化算法,图形运算时间小于dsp平台.另外,zynq平台采用的是ddr3sdram 帧存,操作速率远高于dsp平台采用的sram 帧存,因此写帧存时间远小于dsp平台.由图9和图10可见,在绘制分辨率相同的同一图形时,zynq平台图形生成时间均小于dsp平台,帧率均高于dsp平台.在绘制多种分辨率图形画面,zynq平台帧率均超越60 hz,满足了机载显示器的实时显示要求。
5 结论 针对机载液晶显示器低功耗、小型化的应用需求,提出了一种基于zynq的图形生成电路.运用zynq器件集成的arm cortexga9内核作为核心绘图部件,外部高速ddr3存储器作为图形帧存,对帧存采取三缓冲机制进行数据缓冲处理,配合可编程逻辑资源,可完成多种分辨率图形的实时生成.对zynq平台和dsp平台在多种分辨率下典型画面的图形生成时间和帧率进行了对比测试,测试结果表明,zynq平台性能优于dsp平台.在生成1024×768分辨率的efis图形画面时,zynq平台图形帧率可达74fps,满足机载显示器实时显示需求。

BK3633 BLE和2.4G双模蓝牙简介、原理图及layout指南
rssi定位算法及读取RSSI值程序分享
iPad首发软件提交开始
风速仪如何选型
LoRa组网协议、能力和多点与单点工作的区别
基于Zynq的图形生成电路的软硬件设计
NANO SIM卡座是什么?
警惕“沉默性缺氧”,米尔T507-H核心板的监护仪方案
多级时间轮实现框架
2020年Q1季度我国能源需求下降,工业能源消费量同比下降4.3%
集成电子元件晶体管的工作原理
后疫情时代 自连科技强势角逐医疗千亿蓝海
立式平衡机是什么,立式平衡机有什么优点
高通骁龙835又一部新机诺基亚9跑分曝光 第一坐稳要起飞!
发改委:加快5G、一体化数据中心等新基建项目建设
蓝牙模块选择,电子工程师需要考虑哪些因素?
新技术和趋势推动工业PC市场向前发展
激光雷达传感技术的工作原理及其技术特点的分析
GPU只能整块购买吗,腾讯云GN7实例告诉你答案
高通 CES 发布会汇总:除了 5G 智能手机,高通用大篇幅介绍人和车未来的技术