如何定义网络架构或结构加速视觉系统的优化

当人们讨论深度神经网络(dnn)、深度学习和嵌入式视觉时,通常会先讨论如何定义网络架构或结构。不久之前,我们还只能支持线性网络,在输入和输出级之间的层数非常有限。相比之下,今天的网络技术,如谷歌的tensorflow,支持多个输入、多个输出以及每级多个层。
图1:线性网络、多输入&多输出以及每级多个层
tensorflow的强大令人难以置信,但人工定义tensorflow架构类似于用汇编语言编写一个复杂的软件。因此bonsai等公司开始研究提升抽象等级,帮助更多的开发人员在他们的工作中融合更加丰富的智能模型。一旦定义好网络结构,下一步就是训练这种结构,并用32位浮点系数(“加权”)产生一个新的版本。假设我们在创建某类嵌入式视觉图像处理应用,这个过程——可能会用到数十万甚至数百万幅分类照片——可以在高层进行描述,如图2所示。
图2:创建嵌入式视觉图像处理应用
网络经过训练之后,下一步就是准备部署网络了,这与目标平台有关。假设这是一个性能受限的、具有功耗意识的部署平台,那么浮点网络需要被转换为定点网络,如图3所示(虽然16位定点实现很常见,但低至8位定点的实现也有大量成功的案例)。
图3:浮点网络转换为定点网络
ceva正在做一些非常有意思的研发工作,包括一种网络产生器。这种网络产生器采用基于caffe或tenserflow(任何形式)的网络浮点表示法,并将其转换为小型快速高能效的定点网络,目标应用是ceva-xm4智能视觉处理器。
投入实际使用之前的最后一步是将网络部署进目标系统,目标系统可以是mcu、fpga或基于soc的系统,且可作为目标检测和识别系统的一部分。
图4:将网络部署进目标系统
目前为止情况一切都很好,但是……
还有巨大的改进空间
与大多数事情一样,如果只是随便说说,那么上面的描述听起来也不错。然而,在一线搭建实际系统的开发人员知道,还有许多事情要考虑。
就拿第一步训练网络所用到的图像来说,用什么设备来捕获这些图像?在物理范畴,我们可能会讨论镜头、图像传感器和模拟前端(afe)等东西。在此之上,我们必须考虑图像处理管线(可以用软件函数实现,或使用硬件加速器)中采用的所有算法,比如增益控制、白平衡、噪声抑制和锐化、颜色空间转换、插值、压缩……等等。
当然,所有这一切也适合用于捕获和处理图像的任何后端摄像系统,这些图像最后馈入人工神经网络,实现检测、识别、分类和其它用途。
越来越多的公司将摄像机和智能视觉技术集成进产品中,系统的图像质量和精度是体现其价值的核心。除了镜头和传感器等物理组件,一个典型的图像处理管线可能会达到10级,每级可能有大约25个调整参数。在光学、传感器、处理器和算法组合之间优化这些系统需要付出很大的努力,而且每个产品和衍生品都要完成这一辛苦的工作,因此可能会限制待评估的替代配置的数量。
为了解决这一问题,algolux公司以其机器学习解算器为基础设计了一种最优化的平台架构,名为crisp-ml(运算型可重配置图像信号平台)。这种架构可以根据标准图像测试卡、加有标签的训练图像和关键性能指示器(kpi)目标调整成像和计算机视觉算法,在规定的成像条件下取得理想的图像质量、视觉精度、功耗和性能目标。这种方案可以极大地减少优化一个新视觉系统所需的时间和成本,将专家资源留给价值更高的任务。
当我第一次听到这一切时,第一反应就是algolux的员工正在使用基因算法玩“魔术”。不过,algolux公司首席技术官paul green表示,他们其实并没有使用基因算法,而是使用“有指导性的随机搜索与基于微积分的搜索的一种组合”。哇,这才真正激起了我的兴趣——“真是个坏小子!”。我期望在不远的将来能够学习到更多的内容,并写出更多的报道来。


HTC推出的新旗舰One M9并没有受到欢迎
墨子II型太阳能无人机将5G基站安装在身上,代替传统卫星提供通信服务
视频信号的常见干扰源有哪些?
茂睿芯推出全新一代氮化镓技术LD-GaN
运算放大器有哪些应用?
如何定义网络架构或结构加速视觉系统的优化
数据等创新技术正在加速投入疫情防控的关键应用
「论坛活动」AGV应用潜入深水区,科聪如何赋能客户轻松应对?
特斯拉没有做足工作防止滥用自动驾驶系统?特斯拉发布车祸新声明
TMS320DM365的特点及基于高速网络摄像机系统的设计
乌兰布和沙漠边缘几种典型植被地物光谱特性研究
基于信号接口的自动测试系统软件的设计与实现
浅谈光伏发电技术在农村应用的前景
魅族Pro7大曝光 或将使用联发科10nm工艺处理器?
雷达感应模块在智能家居中的应用
Pixelworks推出集成Pixelworks X5 Pro视觉处理器的一加9 Pro旗舰智能手机
透视 CES 2018:不容错过的四大科技趋势
iPhone6s降至华为Mate9一样的售价, 选择让人很纠结!
高通:Android手机用户明年将用上刷脸功能
“四新”和“独角兽”有望以CDR方式回归A股