第1章 目标检测概述
目标检测是对图像分类任务的进一步加深,他不仅要识别出图片中各种类别的目标,还要把他们的位置找出来用矩形框框住。
在实际操作中,通常先找出目标的位置(通过坐标轴方框标注出来),然后在对标注的目标进行分类。
目标检测是深度学习在计算机视觉领域一个非常重要的应用,从本节开始,我们将陆续开始目标检测的学习。
根据算法的流程可以将目标检测算法分为两种流派:
(1)以faster r-cnn为代表的two-stage算法:
它检测目标主要分为两个部分
通过专门模块去生成候选框
寻找前景以及调整边界框
(2)以ssd、yolo为代表的one-stage算法
它是直接基于anchor直接进行分类以及调整边界框。
这两种方式各有各的特别,two-stage很明显检测的精度要高一点,但是检测速度慢;
one-stage放弃了高精度,但是换来了速度,速度比two-stage算法快很多。
接下来简单介绍几种常用的目标检测算法
第2章 常见的two-stage算法
2.1 r-cnn
在过去的十多年时间里,传统的机器视觉领域,通常采用特征描述子来应对目标识别任务,这些特征描述子最常见的就是 sift 和 hog.而 opencv 有现成的 api 可供大家实现相关的操作。
r-cnn(region with cnn feature)2014年提出,在此之前都是传统的目标检测算法,人为定义特征进行检测,进入了瓶颈期,进步缓慢,但是r-cnn出来之后将目标检测领域的准确率至少提高了30%。
2012 年 krizhevsky 等人在 imagenet 举办的 ilsvrc 目标识别挑战大赛中一战成名,豪夺当年的第一名,top5 错误率 15%,而他们团队提出来的网络结构以第一作者 alex krizhevsky 名字命名,它就是 alexnet
因为 alexnet 的出现,世人的目标识别的目光重回神经网络领域,以此为契机,不断涌出各种各样的网络比如 vgg、googlenet、resnet 等等。
受 alexnet 启发,r-cnn论文作者尝试将 alexnet 在 imagenet 目标识别的能力泛化到 pascal voc 目标检测上面来。
r-cnn 借鉴了滑动窗口思想,采用对区域进行识别的方案
第3章 常见的one-stage算法
3.1 ssd
ssd是一种经典的one-stage算法,它解决当时faster r-cnn对小目标检测效果差和检测速度慢的问题。
ssd可以预测不用尺度的目标,它的网络有6个输出特征层。
使用faster r-cnn在单gpu上大概每秒6、7张图片;
而使用ssd算法,同样在单gpu上它每秒能检测50 、60 张图片;
但相比之前使用了fpn的faster r-cnn而言呢,ssd算法的检测精度要差很多。
3.2 yolo
yolo系列算法是目前使用最多的目标检测算法,它最大的特点就是检测速度快,而且现在检测精度也就是map也变高了,所以称为时下最热门的目标检测算法。
yolo是在cvpr2016提出的一种目标检测算法,它一共有5个版本,yolo v1到v3是同一个作者joseph设计的,包括论文到算法结构,yolo v4到v5是其他作者设计的,目前检测效果最好和使用最多的就是yolo v5。
其核心思想是将目标检测转化为回归问题求解,并基于一个单独的end-to-end网络:完成从原始图像的输入到物体位置和类别的输出。
yolo在进行预测时,会对图像进行全面地推理。
它一种统一的目标检测模型。我们的模型构建简单,可以直接在整张图像上进行训练。
第4章 汇总比较
4.1 汇总比较
华为是第一个推出手机NPU的厂商 鸿蒙OS后续计划如何实施
C语言常见错误:数组越界及其避免方法
vivo游戏嘉年华广州站圆满收官沉浸式游戏体验好评如潮
高效率、高压、降压型DC-DC转换器MAX5033
CTO说了,如果发现谁用kill -9关闭程序就开除
常见目标检测算法大汇总
通过卡固定器表征热性能
揭秘别克昂科拉的五星安全背后的故事
全面介绍因果推断方向的基础方法
介绍Autosar网络管理NM和其他模块之间的对应关系
珠海全志科技采用TSMC 55nm“半世代”工艺成功推出A10芯片平台
3种电池技术克服传统弊端 可能会改变世界
LN8541 1.1MHz轨到轨输入/输出CMOS运算放大器
细看核心网的演变过程(RCAF,PFDF和TSSF)
港交所:12月7日将推出中芯国际、阿里健康等股票期权
华硕天选系列笔记本有什么短板?
诺基亚9.3 PureView或将推迟到明年上半年上市
贸易战持续升级 连接器关税压力加大?华强芯城连接器2000+型号直击底价
TDA2030型立体声功率放大器
如何检测和防止变压器局部放电?