博客迁移之RCNN简单回顾

本博客于本人1.20号在csdn发布
csdn链接 https://blog.csdn.net/qrfaction/article/details/79112431

简单回顾只挑重点
RCNN

大致步骤:

  1. selective search选框
  2. 裁剪缩放到相同尺度送入卷积网络获取高度抽象的描述符
  3. 送入SVM分类
  4. 区域回归


    冗余计算太多。。。没啥好说的吧毕竟是初版

Fast-RCNN

变动有:

  1. 将图像先送入卷积网络,SS选框后获得proposal的坐标,从而可以直接从特征图筛选区域
  2. 提出ROI Pooling将ROI大小统一
  3. end2end训练


    去除了RCNN的proposal冗余的CNN计算

Faster-RCNN

变动有:

  1. 提出PRN网络替代selective search选框(对特征图上的每个点进行前后景分类,坐标回归,配合anchor)


    selective search那种图像筛选方式效率太低 PRN在特征图上分类回归生成proposal要强不少

Mask RCNN

变动有:

  1. 基础网络的强化 ResNeXt-101+FPN
  2. 加入了mask分支,同时做了分割任务
  3. ROI Align 替代ROI Pooling
      ROI Pooling的操作会对分割任务带来微小的偏移
      ROI Align通过双线性插值减小了这个影响


    感觉变化不如前两个大 就加强了基础网络以及多做了个分割任务

Light-Head RCNN

变动有:

  1. 指出faster-rcnn后接的两个fc计算量过大
  2. 指出R-FCN的position-sensitive scores map channel过多导致PSROI计算量过大
  3. faster-rcnn 与 R-FCN结合 用separable convolution缩减特征图通道,在这里由于通道缩减 无法直接投票,接上一个全连接层回归分类
  4. 去掉了全局池化利于回归