博客迁移之RCNN简单回顾

本博客于本人1.20号在csdn发布
csdn链接 https://blog.csdn.net/qrfaction/article/details/79112431

简单回顾只挑重点
RCNN

大致步骤:

selective search选框

裁剪缩放到相同尺度送入卷积网络获取高度抽象的描述符

送入SVM分类

区域回归

冗余计算太多。。。没啥好说的吧毕竟是初版

Fast-RCNN

变动有：

将图像先送入卷积网络，SS选框后获得proposal的坐标，从而可以直接从特征图筛选区域

提出ROI Pooling将ROI大小统一

end2end训练

去除了RCNN的proposal冗余的CNN计算

Faster-RCNN

变动有：

提出PRN网络替代selective search选框(对特征图上的每个点进行前后景分类,坐标回归,配合anchor)

selective search那种图像筛选方式效率太低 PRN在特征图上分类回归生成proposal要强不少

Mask RCNN

变动有：

基础网络的强化 ResNeXt-101+FPN

加入了mask分支,同时做了分割任务

ROI Align 替代ROI Pooling
　　ROI Pooling的操作会对分割任务带来微小的偏移
　　ROI Align通过双线性插值减小了这个影响

感觉变化不如前两个大就加强了基础网络以及多做了个分割任务

Light-Head RCNN

变动有：

指出faster-rcnn后接的两个fc计算量过大

指出R-FCN的position-sensitive scores map channel过多导致PSROI计算量过大

faster-rcnn 与 R-FCN结合用separable convolution缩减特征图通道，在这里由于通道缩减无法直接投票，接上一个全连接层回归分类

去掉了全局池化利于回归