运用菱形十字搜索算法提高快速运动估计算法的性能

引言
h．264采用了减少视频图像各帧间冗余度的运动估计算法。运动估计算法传统的有全搜索(fs)、三步搜索(tss)、新三步搜索(ntss)、四步搜索(fss)等；常用的是钻石搜索(ds)和非对称十字交叉多层次六边形格点运动搜索算法(umhexagons)。运动估计是整个视频编码中运算量最大的模块，可占整个软件编码器运算量的70％以上。因此视频系统中编码器的复杂部分取决于运动估计算法体系结构的复杂性。
1 运动估计算法分析
1．1 钻石搜索(ds)算法
ds算法即钻石搜索算法，被mpeg-4国际标准采用并收入验证模型vm(verification model)中，是mpeg-4建议采用的快速运动估计算法。 ds算法采用了两种搜索模板，分别是有9个检测点的大模板和有5个检测点的小模板。搜索时先用大模板ldsp在搜索区域中心及周围8个点处进行匹配计算，当最小块误差出现在中心点处时，将大模板ldsp换为sdsp，再进行匹配计算，这时5个点中的mbd(minimum block distortion)即为最优匹配点；否则，改变中心位置，仍用ldsp重复计算。
1．2 菱形十字搜索(dcs)算法
菱形十字搜索算法(dcs)算法是在ds算法基础上改进而来，dcs的匹配模板是建立在两种不同的搜索模板之上的，即大菱形十字型(ldcsp)和小菱形十字型(sdcsp)，如图1所示。其中，十字型可以对应于实际的运动的矢量分布，而交叉型则是为了加速搜索效果。
dcs算法在进行运动估计匹配运算时，有三种可能的情况：
(1)若mbd点位于ldcsp中心位置，说明图像是静止的，dcs算法一步结束；
(2)若mbd点位于ldcsp小十字位置，说明图像的运动较小，则在此基础上按照sdcsp模板反复进行交叉搜索。
(3)若mbd点位于ldcsp大十字位置，说明图像的运动较大，则在此基础上按照ldcsp模板反复进行交叉搜索。
由此可以看出，dcs算法的优点是，可以根据图像的运动类型(如上述三种情况)，白适应选择下一步相应的搜索模板，使搜索与图像内容有关(基于内容的搜索)，从而得到较好的搜索效果；dcs算法的搜索并不一定要经历模板由大到小的必然过程，有时一步即可完成搜索；用dcs搜索时，十字形模板对应于实际的运动矢量分布，交叉形模板则有准确性“聚焦”特性，这从本质上体现了dcs是粗定位和准确定位的有效结合。
视频图像的运动矢量大部分为零矢量或运动很小的矢量。运动矢量为零的块称为静止块；运动矢量很小的块(以搜索窗口中心为圆心，两像素为半径的圆内)称为准静止块：而其他的称为运动块。如果有超过80％运动矢量很小的块可被看作静止或准静止块。因此，可设一个阀值t，当运动矢量的值小于t时，可用sdcsp搜索法直接进行精确定位，找出最优点；当运动矢量的值大于t时，可用ldcsp搜索算法找出最优点。
运动矢量空间域的预测方式有运动矢量中值预测、空间域的上层块模式运动矢量；在时间域的预测方式有前帧对应块运动矢量预测和时间域的邻近参考帧运动矢量预测。本文采用运动矢量中值预测方式。根据与当前e块相邻的左边a块，上边b块和右上边c块的运动矢量，取中值作为当前块的预测运动矢量。如图2所示。
设当前要编码块e的运动矢量为mvp。如果运动矢量的值mvp≥t，则与e块相邻的各块间运动的相关性较高，表明该区域的变化比较平缓；如果运动矢量的值mvp
3 自适应运动估计算法
结合上述dcs算法和阈值的确定，可采取先对视频图像的运动块进行阈值的判断，再根据判断结果进行最佳匹配块的搜索。具体搜索步骤描述如下：
step 1：判断当前块运动矢量mvp和阈值确大小。若mvp≥t，则进入step 2；若mvp
step 2：用ldcsp在搜索区域中心及周围8个点进行匹配运算，然后判断，找出mbd点。若mbd点位于中心点，说明宏块是静止的，dcs算法一步结束，得到最优匹配块；否则进行step 3。
step 3：若mbd点为ldcsp模版的小十字处，以该点为中心构建sdcsp进行匹配计算，若mbd点位于中心点，所得mbd点为所求。否则，进入step 4。
step 4：若mbd点为ldcsp模版的大十字处，以该点为中心构建lcsp进行匹配计算，进入step 2。
step 5：用ldcsp在搜索区域中心及周围5个点进行匹配运算，然后判断，找出mbd点。若mbd点位于中心点，所得mbd点为所求；否则继续step 5。
算法流程图如图3所示。
实验结果及说明
用搜索时间和psnr值两个指标来验证dcs的性能。本节实验用到的所有视频文件均为qcif(quartet commonintermediate format)格式。实验以主频1．8ghz的pc机上运行的visualc++6．0为平台。测试对象为：missa、salesman、news、grandmother、foreman、carphone、claire，搜索范围为16×16的矩形框，量化范围为2～12，测试序列中每帧图像的大小为176×144。
4．1 搜索时间的比较
为了时间测试的准确性，测试时采用的是vc++提供的两个精确时间函数：queryperformancefrequency()和ouerperformancecounter()精度对标准测试序列missa、salesman、news、grandmother、foreman、carphone进行精确测定，得表1(数据均为三次测量所求得的平均值)。
从表1可知：a．fs搜索效果最佳，但耗时太长；ds算法有较大改进，可以实现实时压缩；dcs比ds，运行时间都有不同程度的减少，故dcs算法在搜索速度有优势。b．从单个序列来看，dcs算法对missa和salesman时间优化最为显著，分别只占fs算法的7．42％、7．50％和ds算法的98．17％、97．49％；对carphone序列的搜索速度也有很大优化，占fs搜索算法的7．97％和ds算法的97．82％。综合视频特性可知：dcs算法针对运动平缓的视频对象搜索速度优化明显。
4．2 信噪比的比较
对标准测试序列claire和carphone序列进行测定，计算psnr得表2。
表2中fs的平均psnr最高，达到42．38，但搜索时间最长；ds的psnr最低，为42．31，而dcs为42．35，高于ds算法，且仅低于fs算法0．03db。从单个序列来看，dcs算法对claire的优化程度最大，超过了fs的psnr值，说明dcs算法身体静止仅面部表情运动特点视频适用。用dcs算法计算得到的carphone的psnr值虽然低于fs算法，但高于ds算法；missa序列的dcs算法的psnr值和fs、ds法的相差不大。故dcs算法在搜索速度、图像质量上均有保证。
5 结束语
本文从搜索时间和图像质量两方面对各种块匹配运动估计算法进行了性能分析比较。实验结果表明，将菱形十字交叉搜索算法和阈值判断结合，在搜索速度方面，有很大程度的优化，而且能得到与fs、ds搜索算法相当的图像质量。dcs算法针对运动平缓的视频作用明显，由此推知该算法适用于电视电话、远程教育等实时视频压缩。

优派携虹系列激光电视与高阶影音室投影机TB2109K亮相此次展会
鸿蒙系统有什么不一样
ToolLLM：促进大型语言模型掌握16000+真实世界的APIs
Kubernetes容器垃圾回收的策略
硅钢片激光焊接的优势和难点
运用菱形十字搜索算法提高快速运动估计算法的性能
华为已经逐渐成为全球芯片企业的重要客户
触摸广告机如何应用在各行各业，它有哪些优势
cqrs是什么意思 DDD与CQRS的组合使用优势
如何选择合适的PCB打码设备？
我国新能源公共充电桩 55.8 万个，位居世界首位
小米mix2什么时候发布？小米mix2亮相：无敌屏占比，价格奇高
福禄克与您相约2017年11月20日上海国际电力展
大功率LED照明散热的探讨
iPhone 8 Plus透明屏有哪些挑战和限制？
智慧汇聚科技让物流更有“质”感
夏天电脑CPU太烫？“核心直触散热支架”了解一下
如何在Windows下使用 Supervisor 重新拉起崩溃的Python程序
工业以太网应用实例
Redmi K30 5G版将于1月7日开售搭载骁龙765G平台支持双模5G网络