本博客于本人1.20号在csdn发布
csdn链接 https://blog.csdn.net/qrfaction/article/details/79112431
简单回顾只挑重点
RCNN
大致步骤:
- selective search选框
- 裁剪缩放到相同尺度送入卷积网络获取高度抽象的描述符
- 送入SVM分类
- 区域回归
冗余计算太多。。。没啥好说的吧毕竟是初版
Fast-RCNN
变动有:
- 将图像先送入卷积网络,SS选框后获得proposal的坐标,从而可以直接从特征图筛选区域
- 提出ROI Pooling将ROI大小统一
- end2end训练
去除了RCNN的proposal冗余的CNN计算
Faster-RCNN
变动有:
- 提出PRN网络替代selective search选框(对特征图上的每个点进行前后景分类,坐标回归,配合anchor)
selective search那种图像筛选方式效率太低 PRN在特征图上分类回归生成proposal要强不少
Mask RCNN
变动有:
- 基础网络的强化 ResNeXt-101+FPN
- 加入了mask分支,同时做了分割任务
- ROI Align 替代ROI Pooling
ROI Pooling的操作会对分割任务带来微小的偏移
ROI Align通过双线性插值减小了这个影响
感觉变化不如前两个大 就加强了基础网络以及多做了个分割任务
Light-Head RCNN
变动有:
- 指出faster-rcnn后接的两个fc计算量过大
- 指出R-FCN的position-sensitive scores map channel过多导致PSROI计算量过大
- faster-rcnn 与 R-FCN结合 用separable convolution缩减特征图通道,在这里由于通道缩减 无法直接投票,接上一个全连接层回归分类
- 去掉了全局池化利于回归