在PowerVR GPU上使用卷积神经网络进行物体识别

本周在加利福利亚举办的嵌入式视觉峰会(evs)上,我们展示了最新的卷积神经网络(cnn)物体识别演示。自在去年的evs大会上发布原始演示以来,我们对其进行了多番扩展,目前,演示已扩展到涵括多个网络模型,且目前使用的是imagination的图像编译库——img dnn。
何谓cnn? 首先,让我们快速回顾下cnn:cnn是机器学习的分支,试图模仿人类视觉皮层的行为来获得对图像的理解,这样,依据应用程序,特定的功能可以被识别。值得注意的是,cnn并不局限于视觉应用程序,不过本文我们将关注视觉应用。常见的视觉应用案例包括:面部识别、汽车牌照字符识别等。cnn由许多层组成,输入图像以隔离某些特性,或输出某些有意义的值时,各层将执行不同的操作。cnn与其他深层神经网络(dnn)的差别在于,cnn的各层使用了图像卷积过滤器。以车牌字符识别为例,操作可能包括边缘检测,以及使用其他卷积过滤来提取重要特征,且输出的车牌信息是文本的形式。
在投入使用之前,已利用训练数据集对cnn进行了训练。这些数据集非常强大。在上述的案例中,训练数据可能包含了数万或数十万车牌图像。简言之,cnn充满了训练数据与预期的输出值。如果cnn的输出与预期的输出不匹配,那么cnn便会自行纠正——调整其在网络中使用的权重和系数。这个过程会一直持续到cnn生成训练数据可以接受的输出值为止。这样一来,才认为cnn是经过训练的,并让其在具有新输入值的领域使用。
演示 我们的演示使用了一个实时的摄像头,可以识别出摄像机所指向的物体。摄像机帧传入cnn,屏幕上会输出一个标签和置信度百分比,说明网络对输入图像进行响应的确定性。该演示在linux上运行,基于acer r13 chromebook,包括powervr rogue gx6250 gpu。
演示程序实施了三个著名的网络模型——alexnet、 googlenet inception v1和 vgg-16。每个网络都有不同的特征,这意味着不同的网络在不同的场景下可能表现更好。这里,关键的高级特征是操作的次数和内存的使用,其将直接影响网络的速度和准确性。演示中使用的所有网络都是caffe型的,使用imagenet数据集进行了训练。
alexnet是最近一波新网络模型的首例,其通过扩大早期lenet(仅限于字符识别)的范围,将cnn引入到深度学习中,以学习更复杂的对象。它的特点是:拥有相当高的内存使用率,相对较少的操作,但相比最近的网络模型准确度欠佳。
相比其他网络模型,googlenet inception v1内存占用量明显更小。而相比alexnet,它执行的操作更多,但准确性更高。
vgg-16在三个网络模型中准确度最高,但目前,内存占用量最大,操作次数最多,故而相比其他模型,输出速度要慢很多。
研究这些计算量或内存占用量相对较大的模型看似奇怪,但考虑每个网络的实用案例确实很重要。在有的应用程序中,准确度相当关键,但对于新的结果并非经常需要。相反,有的情况下,快速推断是首选,但却失去了绝对的精准度。网络如vgg-16因为使用的内存量和所需的操作次数,也常用作基准测试和压力测试。
以上视频展示了googlenet和alexnet模型处理相同图像的情况。可见二者皆运行良好,但alexnet在某些情况下的确表现不佳。
img dnn 所有这些网络都是通过使用imagination的dnn库实施。dnn库也是powervr gpu驱动程序的一部分。该库是dnn图像编译器和优化器,专为powervr量身打造。本文的演示虽是关于cnn,但dnn库可以用于加速任何类型的深度神经网络。
img dnn位于 opencl的顶层,但并不模糊,且其利用了opencl结构,因此可以与其他定制opencl代码一起使用。库执行低层特定硬件的优化,相比定制用户opencl的执行,其可以更好地优化图像。库充分考虑了底层powervr硬件的性能特征(如内存带宽、alu的数量),随后将网络图视作一个整体,以此在powervr gpu中得到最优的结果,实现性能的可移植性。
嵌入式视觉峰会 该演示将于5月1日至3日在加利福利亚举办的嵌入式视觉峰会(evs)上进行展示。欢迎大家参与讨论,了解更多有关powervr加速cnn的资讯。
imagination的保罗·布莱斯莱特将在峰会上发布主旨演讲:“训练cnn以获得精准推理”。想了解更多,请关注基于数量识别cnn的演示,该演示使用的openvx具有cnn扩展。

和监控安防系统息息相关的NTP网络时间服务器
Intel人工智能产品线的最全盘点
关于便携式功率分析仪PC机调试软件设计
意法半导体的STGAP2DM栅极驱动器的功能
单片机硬件仿真与烧写程序结果同的原因分析
在PowerVR GPU上使用卷积神经网络进行物体识别
2013年数据采集技术主要趋势展望
为什么数据中心普遍要求采用专用光纤桥架进行敷设呢?
BAT跨界抢进,中国半导体行业迎机遇
SysTools OutlookOST Finder软件的突出功能
plc系统运行环境的主要事项有哪些
音响机器中如何避免电源变压器产生的干扰,噪音干扰
山东联通联合中兴通讯打造5G网络智能矿山开采
巨头争相涌入,VR/AR崛起道路上已无障碍
核能发电的燃料是什么_核能发电发展趋势
洁净室的规程与规定
苹果自研GPU如此强悍:性能至少领先对手一代
基于ADV7125的嵌入式系统VGA接口设计
中国将引领5G发展
随选回放和培训简报下载-探索低功耗蓝牙及其网状网络和定位服务开发